化学構造の多様性を考慮した分子設計

分子を設計するというテーマは化学者にとって非常に魅力的なテーマであるとともに、設計対象に応じて、専門家レベルでの深い知識が必要となる。し かし、分子の設計に長年携わってきた研究者でさえ、所望の機能を持つ構造を思いのままに設計することはたいへん難しい作業であり、人類の歴史を振り返って みると、独創力やセレンディピティにより望ましい性質を持つ分子が設計(発見)されてきた。

過去の知識を有益に活用した上で、人間の発想力をカバーする形で分子を設計することが本研究室の目的である。コンピュータによるアルゴリズムの 特徴である網羅性に、過去の知識を活用するためにQSPR/QSARモデル、データマイニングや機械学習やパターン認識の手法を組み合わせる。とりわけ創 薬化学(薬剤設計)における分子設計では、標的タンパク質に対して高い親和性を持つ新規構造(低分子)を設計する(リガンドベース)という課題を、2つの 異なるアプローチから取り組んでいる。

一つ目は、Inverse-QSARを利用した方法である。QSARモデルを逆解析することで、モデルが示す予測親和性が望ましい値となる領域 を化学空間において特定することが可能となる。そのような化学空間における特定領域に存在する構造のみを、構造生成機(構造ジェネレータ)が網羅的に組み 立てる。ここでは、構造を組み立てるということは化学グラフを構築することに相当し、実際に組み立てた構造が分子として存在するのか、また合成することが できるのかということを厳密に評価することは、別の課題となる(合成可能性、安定性に関する研究も行っている)。分子を組み立てる部品は、原子単位である フラグメントに加え、Bemisと Murckoが提唱したRing System を利用する(部品はQSARモデルを構築したデータセットから収集する)。多数の構造を組み立てると同時にそれらの善し悪しを評価することが必要となるた め、計算速度を向上させるための様々な工夫が構造ジェネレータに施されている。

別のアプローチでは、化学空間におけるある領域に狙い撃ちで分子を設計する。このシステム(de novo design algorithm for exploring chemical space, DAECS)は、次元削減手法であるGenerative Topographic Mapping (GTM) を利用し、過去の知識である測定データが集中している部分空間を作成する。GTMを用いて作成したマップにQSARモデルによる予測値を写像することによ り、親和性予測値の地図を作成する。この地図は、親和性の予測値に加え、構造の特徴を反映させたものとなる。それ故、地図をもとに化学構造と親和性との関 係を解釈することが可能となり、製薬会社などで創薬研究に携わっている薬学者が興味のある領域を地図上で特定し、DAECSがその領域に存在する構造を生 成することができる。解析者と対話する形で構造を生成することがDAECSの特徴の一つである。また、DAECSには多様な分子を設計するための仕組みを 組み込んでいるため、提案構造の分子骨格の多様性が期待される。

str1

str2