卒業論文・修士論文の概要 2017年度

修士論文

中川 智貴 活性と相関ある分子骨格を判定する手法の開発
 化学構造から側鎖を取り除いて得られる分子骨格は、複数の構造に共通する「核」として、化学構造に関する研究開発に利用される。特に創薬において、薬理活性を持つ化合物に共通する分子骨格は、「活性と相関ある分子骨格」と呼ばれ、低分子医薬品の構造を最適化する際の起点となる。従来、活性と相関ある分子骨格は、創薬化学者の知見により取得されてきたが、近年は実験工程の自動化が進んだことで候補の骨格数が膨大となり、全てを創薬化学者の知見に基づき判断することは現実的ではない。
そこで本研究では、活性と相関ある分子骨格を、統計学的アプローチにより提示することのできるシステムの構築を目指した。提案手法は、分子骨格に官能基を付与して多様な誘導体を生成する構造生成器と、その誘導体が薬理活性を持つかを予測する統計手法を組み合わせることで、活性と相関ある分子骨格を提案できる。提案手法の有用性を確認するために、全4つのケーススタディを実施した。ケーススタディ1では、提案手法により算出されるスコアが、分子骨格の活性との相関を表すことに使用できることを確認した。ケーススタディ2では、大量の分子骨格の中から、活性と相関ある分子骨格の同定を行った。ケーススタディ3と4では、複数の標的タンパク質に対する活性との相関を考慮しながら、分子骨格を選択した。本成果は、先行事例のないアプローチで分子骨格の活性との相関を評価した、創薬研究を加速させる可能性を秘めた重要な成果である。
 
前田 巌 実測値の不確かさを考慮した活性予測モデル構築
 Compound-protein interactions (CPIs)は、化合物とタンパク質の相互作用を表す。CPIsの体系的な理解は、医薬品開発の初期段階におけるシード構造探索において重要であるが、CPIsを構成する化学構造およびタンパク質の数が莫大であるため、生理活性実験による網羅的な探索は現実的ではない。そこで、機械学習を用いたCPIsの予測が行われている。機械学習を用いたCPIsの予測では、活性既知の化合物―タンパク質ペアから活性予測モデルを学習する。活性予測モデルに化学構造およびタンパク質を入力すると、活性の有無あるいは活性値の予測が出力され、実験を必要としないCPIsの把握が可能となる。活性予測モデルはその出力の形式により、識別モデルおよび回帰モデルに分類される。識別モデルでは活性の有無を予測するのに対し、回帰モデルではKi, Kd, IC50といった活性値を連続値として予測するため、より定量的な活性の評価を行うことが可能である。しかし、このような活性値の回帰分析には問題がある。実験により測定される活性値は同じ化合物―タンパク質の組み合わせにおいても、実験手順・実験条件・実験者の技量等により大きくばらつくことが知られている。通常の回帰モデル構築手法は出力値の不確かさを考慮できないため、同じ化合物に対し複数の異なる活性値が存在するデータに対しては適切にモデルを学習させることができない。
不確かさを考慮した回帰モデル構築手法としてGaussian Process (GP)が存在する。GPは入力に対し、出力値の分布を正規分布として出力する手法であり、不確かさを考慮したモデル構築が可能である。GPのモデル構築は通常、モデル構築用データに対する尤度を最大化するように内部パラメータの最適化が行われる。外れ値が数多く存在し、実験値の数が少ないCPIsデータを用いて学習したGPモデルが、CPIsデータの不確かさを適切に評価できるかは不明である。
この問題を解決するため、本研究ではより外れ値に強い推定値であるnormalized mean absolute deviation (MADN)と実測値の差を用いたモデル構築用データの標準偏差推定をGPの最適化プロセスに組み込むことで、データの不確かさの大きさを適切に評価するGPモデル構築手法を開発した。
 
弓削 伸宏 適応的ソフトセンサーモデルの選択的使用法の開発
 ソフトセンサーとは、例えば産業プラント等の化学プロセスにおいて、温度・圧力・流量といった測定に時間のかからない変数Xから濃度といった測定に時間のかかる変数yを、統計回帰手法を用いて予測する仮想的な計測技術のことである。実際の化学プロセスは、配管への汚れ付着・触媒の劣化・恣意的な操作変更・外気温変化などでプロセス状態が時間変化し、回帰モデルの予測精度が悪化する。予測精度の悪化を避けるため、新たに得られたサンプルを用いてyの予測に用いる回帰モデルを更新する適応的ソフトセンサーが基本的に使用される。回帰モデルの更新機構は様々に提案されており、それぞれプロセス状態の時間変化に対し得意・不得意が存在する。したがって、複数の回帰モデルの更新機構を使い分けることで、適応的ソフトセンサーで精度良く予測を行い続けることができる。
本研究では、回帰モデルの更新機構の併用による適応的ソフトセンサーの予測精度向上を目的とし、予測精度が最も良いと思われる回帰モデルの更新機構を選択する手法を提案する。提案手法は、図に示すように、プロセス状態に関係する指標から予測誤差を推定し、比較することで、回帰モデルの更新機構を選択する。数値シミュレーションデータおよび実プロセスデータに提案手法を適用した結果、適応的ソフトセンサーの予測精度が向上するように回帰モデルの更新機構の切り替えが行えることを確認した。
 

図. 提案する回帰モデル更新機構選択法

渡邉 拓朗 ソフトセンサーモデルとその逆解析を利用したプロセス制御手法の開発
 プロセス産業においては、製品品質や生産効率の向上のために迅速かつ安定な制御が求められている。その中で、多様な制約・制御目的を扱うことができるモデル予測制御(MPC)に近年注目が集まっている。MPCは操作変数Uから制御変数yの応答を予測するモデルを用いて、yが優れた応答を示すUを求める。しかし、一般的に最適な操作は運転中にリアルタイムで探索するため、時間的な制約により評価関数の複雑性と最適化頻度の間にトレードオフがあることが懸念される。そのためモデルの予測の信頼性について考慮された研究例はほぼなく、得られた操作の信頼性は十分に検討されていない。本研究では、モデルの予測信頼性も考慮して操作を探索するモデル駆動型制御手法を開発した。
提案手法は運転前に予めモデルの逆解析を行い、優れた操作を探索する。逆解析では多様な操作の候補を作成、モデルに入力してyの予測値を得る。この時、操作変数以外の変数などの運転条件はある条件を仮定する。yの予測値から制御性能及び予測の信頼性を表す指標を計算し、これらの指標を基に最適な操作Uoptを求める。リアルタイムでの最適化ではないため、計算時間の制約を受けにくい点が特徴である。求めたUoptを基に運転を行うが、運転条件が逆解析における仮定と異なった場合等は予測した制御を行えない可能性がある。そこで、実際の運転条件においてyが優れた応答を返すようにUoptを修正する。この時、修正された操作UadjはUoptに定数dUを加算して定義する。この定義法により、Uadjが優れた操作Uoptの変動の特長を反映できる、さらに最適化するパラメタを削減できる。
提案手法を操作変数3個、制御変数3個を持つ反応器プロセスシミュレータに導入し、提案手法はPI制御, 一般的なMPCより優れた制御性能を示した。また、提案操作修正機構の計算時間を計測し、リアルタイムで実行可能であることを確認した。
 

卒業論文

加藤 涼太 原子座標を用いた物性予測手法の開発
 化合物を合成する前にその物性を予測することは、医薬品などの開発を効率化する上で重要であり、様々な手法が提案されている。その一種として、機械学習を用いて化合物の構造と物性値の間の関係を学習する定量的構造物性相関(QSPR)が存在する。QSPRを行うためには分子構造を数値的に表現する必要があり、その代表的な手法として、記述子の計算が行われている。しかし、分子の3次元構造を考慮する3次元記述子は、予測に有用でない場合もあり、利用される例は少ない。一方で、記述子を計算することなく、原子の3次元座標を入力として構造のポテンシャルエネルギーを予測する手法 [Smith, J. S., et. al. (2017). Chemical science, 8(4), 3192-3203.] も提案されている。しかし、この手法はエネルギーの予測に特化したものであり、一般的な予測対象への拡張性は低いと考えられる。そこで本研究では、再帰型ニューラルネットワーク(RNN)を用いることで、原子の3次元座標と原子番号を入力とし、一般的な対象に適用可能な物性予測手法を提案した。また、複数の座標系を用いた予測を行うことで予測精度を向上し、オクタノール水分配係数の予測において記述子を用いる既存手法を上回る予測精度を実現した。
 
佐方 冬彩子 無機材料の組成を元にした物性予測のための記述子開発
 材料開発において、無数に存在する元素の組み合わせの中から求める物性を持つ材料を効率よく発見するためには、非実験的な方法による物性推定手法が必要である。これまでは主に、結晶構造が既知である物質の物性を予測する方法が提案されてきた。しかし未合成の材料も含めたさらに広範囲の探索を行うためには、組成の情報のみから物性を予測する手法の開発が要求される。そこで本研究では、既知データの組成と物性の関係から統計モデルを構築する手法を用いて物性予測を行った。そのようなモデル構築の際、組成の情報を統計的に扱えるように数値に変換する必要がある。様々な物性の予測を行えるように情報を損失なく変換するためには多様な記述子が必要となるが、無機材料の組成を表す記述子はまだ確立していない。本研究では組成に含まれる原子の個数や原子量、電気陰性度などを元に381個の記述子を提案し、それを用いた結晶密度および屈折率の予測が可能であることを確認した。また、統計的に選択されモデル構築に寄与する記述子は、化学的知見から考えても妥当なものであることからもこの手法の有用性を確認した。
 
曽谷 亮太 電子エネルギー損失分光法スペクトルを対象とした元素分布定量化手法の開発
 半導体/金属間の接触抵抗は半導体開発時の課題の一つである。対策として半導体と金属との間に薄い酸化膜層を絶縁体として挿入した半導体/絶縁体/金属(Metal-Insulator-Semiconductor, MIS)構造による接触抵抗の低減が試みられている。この際、半導体製造時の熱処理によって酸化膜内の酸素が拡散し、接触抵抗が増加する問題が挙げられている。対策として、酸素の拡散が起こりにくい材料および製造プロセスの探索が進められている。探索を効率化する為には、MIS構造において酸素の拡散状態を定量的に把握する手法が必要となる。
本研究では熱処理前後のMIS構造のElectron Energy Loss Spectroscopy(EELS)のデータから、熱処理による酸素の拡散を定量的に把握するための元素分布定量化手法の開発を目指した。Multivariate Curve Resolution Alternative Least Squares(MCRALS)とスムージングを組み合わせた手法を用いて、適切な条件で解析を行い、 2種の異なる試料の熱処理前後の元素分布を定量化した。
 
高柳 匡克 廃棄物焼却発電プラントにおける蒸気量の将来予測
 廃棄物焼却発電プラントは、廃棄物の焼却により得られた熱を利用して蒸気を発生させ、タービンを回し発電を行うプラントであり、新しい電力源のひとつとして期待されているが、発電の不安定性という課題点も存在する。これは、廃棄物の性状、特に、発熱量にばらつきが存在し、蒸気量が安定しないことが原因とされている。現状、この問題に対処するために蒸気量の変動に応じた制御を行っているが、このような制御は蒸気量に反映されるまでに時間がかかるため、蒸気量の将来予測が求められている。そこで、本研究では蒸気量の将来予測を実現させることを目的とし、そのためソフトセンサを応用した。
本研究の概要は、図のように過去の運転データから現時刻の温度や流量、圧力などの説明変数Xと5分先の蒸気量yとの間にモデルを構築する。そのモデルに新しい運転データの現時刻のXを代入することで、5分先の蒸気量の予測値を得るというものである。
実際に蒸気量の5分先予測を行った。しかし、5分先予測では予測遅れが生じてしまい、充分な予測とはならなかった。そこで、予測遅れなく予測可能な時間の探索を行った。その結果、1分先予測まで予測が可能であるという結果が得られ、これは燃焼ガスの滞留時間が1分であることと合致する結果となった。