未探索の新物質をデスクトップで発掘しよう。

化学でおなじみの分子模型を使って最初に作ってみるもののひとつに、炭素6個、水素6個が対称に並ぶ「ベンゼン環(C6H6)」があります。「では炭素6個+水素6個で作ることができる分子は、全部でいくつあると思いますか?」──原子間のトポロジカルな結合関係に基づいて分子構造を数え上げると、答えは217種になるそうです。ところが「量子化学計算で探索していくと、安定な構造だけで6,000以上」にものぼるとのこと。「データ中心ケミストリ」が推進する「埋蔵分子発掘プロジェクト」は、新しい計算方法が可能にした膨大な物質の可能性の中から、目的に合った「新規物質」が効率的に発見できる高精度なデータベースを目指しています。科学的な発見にとどまらず、創薬、バイオ、材料科学にもつながるなど、基礎研究ならではの応用範囲の幅広さも大きな特徴です。研究を率いる佐藤寛子准教授(国立情報学研究所)がご紹介します。

ビッグデータから新しい物質を探り出す

私たちの世界にある化合物は、人工化合物も含めて約7,000万種類あり、毎年数10万〜100万ぐらいずつ増え続けています。ところが、量子化学計算によって理論的に存在可能な分子を探索していくと、それをはるかに凌駕する数の物質が存在することがだんだん分かってきました。ベンゼン環の部品だけでも何千種類以上もあるのですから、まさにビッグデータになるんですね。化学の分野では、これまで物質の沸点・融点などの基本的な物性や、質量分析、結晶構造解析などの分光学により得られる分子構造に関するデータ、化学反応の情報など、主に実験によって集められた実験データが扱われてきています。今、私たちが進めているのは、もう一つのデータ、つまりコンピュータを使って計算によって得られるデータです。しかも、いったん式を与えればコンピュータが自動的に探索して、どんどんデータを蓄積してくれるようなシステムを構築しているところです。

化学反応シミュレーションに不可欠な量子化学計算

分子構造を計算よって求める理論的な方法には大きく2つあり、その1つは、分子や原子の間に働く力学をパラメータ化した「分子力学計算」です。計算量が比較的少ないため、タンパク質などの大きな分子構造の構造解析によく使われています。もう1つは、量子力学をベースに電子の動きまで考慮できる「量子化学計算」です。化学反応は電子の移動によって起こるため、化学反応のシミュレーションには、量子化学計算が不可欠なんですね。ただし計算に時間がかかるため、大きな系に適用する際には、一般的に、2つの計算方法を組み合わせるなどの工夫がされることが多いです。量子化学理論に基づいて化学反応経路を探索する具体的なソフトウェアとしては、10年ほど前から当時東北大学の大野公一先生前田理先生が「GRRM (Global Reaction Route Map) 法」の開発を始められ、従来法では4原子までしか扱えなかったのが、これによって理論的には無限に大きな系でも計算可能になりました。「データ中心ケミストリ」ではこのGRRM法を用いて、化学反応経路データベースを構築し、ケモインフォマティクスやデータマイニングによる新規物質や化学反応の発見や設計を行うことを目指しています。また可視化や化学反応経路解析ツールの提供によって広く量子化学の研究者・技術者にデータベースを利用可能にする計画です。

化学反応の広大な探索空間のトレイルマップを描き出す

私たちは、分子構造を数え上げるもうひとつの方法「トポロジカル法」と対峙させて、GRRM法を別名「ポテンシャル法」とも呼んでいます。ポテンシャルエネルギーの谷にいるとき分子は安定であり、分子構造が変化するにはエネルギーの壁を越えなければなりません。例えばAという物質からBという物質ができる場合には、このエネルギーの山を超えることによって結合の状態に変化が起こっているのです。山は高いほど越えにくい、つまり反応が起こりにくいと言えます。そして実際には2次元ではなく多次元的な拡がりを持っており、宇宙にもたとえられる広大な「ポテンシャル曲面」を構成しているのです。この曲面を越えるどんなルートがあるのか、いわば"ハイキングトレイル"を自動的に探索し「化学反応経路マップ」を描き出すのがGRRM法です。さらにこのようなトレイルに特徴づけを行い、幾重にも描くことによって、"道しるべ"になるような、より詳細な化学反応の特徴の発見も目指しています。このような「ケモインフォマティクス」に加え、データからの発掘を目指す「データマイニング」による新規物質等の発見・設計、さらにGRRMの分散化・高速化の研究も進めています。

化学反応経路マップの解析ツール「RMapViewer」公開へ

2014年7月にはその最初の成果として化学反応経路マップの解析ツールである「RMapViewer」をウェブ上に公開しました。これを使って、たとえば「CH2O2」という単純な組成式についての化学反応経路マップを選択すると、ネットワーク状のマップが画面に現れます。マップでは、分子と分子がどのような関係で結ばれているか、それらの分子がどの程度安定か、また、分子間のポテンシャルエネルギーの山の高さなどが可視化されています。最もエネルギーの低い2種の分子を分子モデルで表示すると、ギ酸の回転異性体であることがわかります。仮に2つの分子を選んで、一方を「反応物」、もう一方を「生成物」にしてやると、反応物から生成物に至る、可能な「経路」がすべて算出され、エネルギー的に起こりやすい順に表示されます。この中のひとつの経路を選択して「ムービー」を指定すると、化学反応による分子構造の変化が分子モデルのムービーで表示されます。GRRM法は、これまでに、逆合成解析や反応中間体解析、クラスター構造の解析や触媒機構の解析などに適用されてきていますが、「RMapViewer」が提供する化学反応経路マップの解析ツールにより、応用研究が加速され、また、応用研究の幅も広げられていくことを期待しています。化学反応経路マップには、理論的に存在可能な、様々な骨格の分子構造が「埋蔵」されていますので、例えば、ここから創薬のデザインのモチーフを探したり、あるいは既存の実験データも参照しながら、欲しい性質を持った新材料を創り出したりと、さまざまな可能性を拓くことが期待されます。

「RMapViewer」のダウンロードはこちらから。今回のバージョンでは、まだ本格的な解析機能は盛り込まれていないものの、化学反応経路マップがどのようなものかを体験することができるでしょう。今年度中に、GRRMからの出力ファイルをRMapViewerの入力ファイルに変換するプログラムや、新しい解析機能を搭載したバージョンなど、段階的に公開を行い、来年春にはオープンソース化まで進める予定です。「化学ではビジュアルや分子模型はとても重要。”電子が移動して反応する”という電子の動きを矢印で記す教科書にある化学反応機構の図と合わせて、理論的に計算された分子構造の変化をムービーで追うことができればやはりインパクトが違う」と、今後は化学反応経路マップから得られる特徴的な化学反応のムービー等を抽出して、ムービーのみをダウンロードできるようにもする予定。「化学の研究者だけでなく、教育的な目的にもぜひ利用して欲しいですね」。

(文:佐藤寛子・池谷瑠絵 写真:水谷充 公開日:2014/09/10)