データから新事実を探り出すための可視化。

生物、人間社会、宇宙の大量のさまざまなデータが駆使できるようになった現在。しかしデータが増えれば増えるほど、またそれらが時間的、空間的に変化したり、いろいろな情報を合わせ持つほどに、それらの中から重要な情報を抽出する難しさと手間は増していきます。さまざまなデータから、人間が見て直感的に重要な情報を取り出せるような形にしていこうという「イメージデータ解析」プロジェクト。いま世界中で活発な研究が進められているこの分野に取り組む、プロジェクトディレクターの松井知子教授とサブリーダを務める吉田准教授にお聞きしました。

可視化技術のノウハウを蓄積しよう

とにかくいろいろなデータを使って複雑な現象の可視化するということが、私どものプロジェクトの狙っているところです。このプロジェクトでは生物系、神経系、医療関係、それから人間社会というように、異なる分野の研究者たちが集まっていますので、まずはそれぞれ独自に可視化の技術を開発して、そこから互いに利用できるノウハウを蓄積しようと考えています。「イメージデータ解析」の重要な役割の一つは、大量のデータを人が理解できるような形にして、そこから人の目で新しい事実やしくみを推測できるようにすることだと思います。つまり人が見て分からなければ、それをもとに新しいアイデアを考え出すことは難しいと思います。そこで、このような「イメージデータ解析」プロジェクトの具体例として、さっそく吉田先生の研究をご紹介したいと思います。(松井)

線虫の全中枢神経系の活動状態を可視化する

私が扱っているのはライフサイエンスデータで、具体的には線虫の神経回路です。線虫は分子生物学において非常に重要なモデル生物で、神経系を構成する神経細胞(ニューロン)302個のつながりが解剖学的にすべて分かっています。記憶、学習、意思決定などを行う線虫の中枢神経系は、人間で言えば脳にあたります。私たちは、生きた線虫の全神経細胞の活動状態をリアルタイムで計測できるイメージングの技術を作り、現在、最大180個の神経細胞の情報がとれるようになりました。顕微鏡の前に線虫を入れたチューブを置き、臭いなどの刺激を与えてニューロンの間の情報のやりとりを、ニューロンの核内に存在するカルシウムイオン濃度の変化を測定して可視化します。共焦点顕微鏡の立体動画から個々のニューロンの活動状態を推定するには、個々のニューロンの動きを追跡しながら、画像の輝度情報を取得する必要があります。ニューロンの動きをできるだけ見失うことなく、正確に追跡することが求められます。特に、線虫の頭部には多くのニューロンが密集しているため、線虫が不規則に動くと正確な追跡は非常に難しくなります。私たちはベイズ統計学のアイデアに基づき、密集する多数のニューロンの動きを高い精度で追跡するトラッキング手法を開発しました。(写真内、上段の解析結果)。この技術により、刺激に対する神経系のシステム応答を直接観察できるようになり、神経回路の動作原理についていくつかの新しい事実が見つかってきました。(吉田)

「このイメージ解析プロジェクトは、JSTのプログラムCRESTの研究課題『神経系まるごとの観測データに基づく神経回路の動作特性の抽出(代表者:飯野雄一(東京大学))』の一環として、東大・九大の計測グループ、神経回路のシミュレーション・モデルをつくる茨城大のグループと連携して行っています。」という吉田准教授。このうち自身の担当は、データ解析とモデル統合。モデル統合では「モデルとデータを合わせて、データの見えない部分にある状態を推定するという逆問題を解く」という課題に取り組んでいます。

バイオイメージインフォマティクスの革新

ライフサイエンスのイメージング技術は過去10年で急速に進歩しました。細胞や分子のイメージング技術が発展し、生物や医学の研究において静止画や動画データの解析手法が欠かせないものとなり、機械学習やコンピュータビジョン、統計科学の先進技術が急速に導入されています。このような研究分野は、バイオイメージインフォマティクスと呼ばれ、データサイエンスや機械学習の人たちがどんどんこの分野に参入している状況です。データから何ができるかを考えるには、統計やデータサイエンスのセンスが非常に重要な役割を担います。統計科学の独自の視点から問題に対するユニークな切り口を発見し、ライフサイエンスの新しい方法論を提案していくことが私たちの仕事です。(吉田)

隠れた情報としての気持ちを探るソフトウェア

目に見えないたくさんのデータを人間の目で分かる形に変えることからもう一歩踏み込んで、今見えているデータを生み出すさらに元にある心理を探る技術にも注目しています。たとえば人間の動きには、気持ちが明るいとスキップしたり、気持ちが沈んでいれば静かに歩いたりというように、その裏に何らかの気持ちがあってそのような動きになっているということが多いですよね? そこで歩き方の特徴から、いわば隠れた情報としての気持ちを統計的に推定し、より確実に動きを識別するようなソフトを作りました。今後、このソフトをいろいろな識別問題に適用して、それぞれのデータの背後にある隠れた情報を探っていきたいと考えています。(松井)

サブリーダを務める吉田准教授が大学時代に在籍したのは、なんと経済学部。「経済学部で統計をずっとやってきて、今はライフサイエンスです」という。一方、松井教授は情報科学から人工知能・機械学習へ──「ある統計的な規則に従って学習してやれば、自動的に入力と出力の関係が出てくるのが面白い」。そしてコンピュータの発達に伴い、大量データから入出力の関係を自動推定する「モデル選択」技術も高度化しているという。

(文:松井知子・吉田亮・池谷瑠絵 写真:水谷充 公開日:2015/04/10)