研究概要
ヒトゲノム解読計画以来、生命科学の研究スタイルは、大量のゲノム情報を基盤とするデータ駆動型へとパラダイムシフトしつつあります。近年の超並列大規模シーケンサの登場は世界的にもその勢いを加速させていますが、わが国の大学研究機関の対応は大きく立ち後れています。今後の情報ゲノム科学の発展に不可欠な研究コミュニティの形成や、社会にこれらの超大量データを用いた科学知の必要性を認知してもらうためには、早急の基盤形成が必須です。
そこで本プロジェクトでは、最新のゲノムテクノロジーを駆使し、系統的にゲノム・遺伝子関連情報の大規模生産を行う一方、多元的な表現型データを系統的に収集し、それぞれの情報を統計学的に解析する手法の開発を目指します。さらに、これらのデータを統合し、遺伝的相関構造の描出を行うための統計学的手法を開発し、モデル生物の大量のゲノム情報と表現型データに適用してブラッシュアップし、汎用的にゲノム機能と遺伝的ネットワークの抽出を行います。これにより、多数の遺伝因子の高次連関から形成される生物多様性を、システムとして理解することを目指します。
3つのサブテーマが相互にその情報を交換しながら生命現象の新たな方法論を見つけ、データ中心科学ならではの新規な原理と解釈を提案できるよう研究を推進します。(プロジェクトディレクター:倉田のり〔国立遺伝学研究所〕)
プロジェクトの目的
大量ゲノム配列情報や遺伝子発現情報のデータ解析手法と多元的な生物表現型多様性の統計モデリング手法を開発します。両者を統合することにより複雑な遺伝的相関構造を描出するための方法を開発し、モデル生物に適用してゲノム機能とネットワーク抽出を行います。
プロジェクト推進体制
欧米では遺伝実験や大量ゲノムのデータを多様な情報学データや手法および統計学的な処理法で解析して、膨大なゲノム情報を読み解き、かつ再構成・利用する研究が急速に活発化しています。これらの研究は、食糧、環境、医療分野の問題解決に不可欠であり、速やかな研究体勢の確立が必須です。
そこで本プロジェクトでは、「遺伝機能システム学」確立へ向けて、大容量で多元的な遺伝情報を、遺伝学、情報学、統計学により統合的に解析し、複雑な生命・遺伝現象の原理をシステムとして理解する研究を行います。まず国立遺伝学研究所が保有する遺伝資源を軸に、大量ゲノム配列多型情報、遺伝子発現多型情報、表現型多型や経時変化等の多次元・多様な遺伝因子の網羅的データを獲得します。そして国立情報学研究所の情報処理技術、さらに統計数理研究所の統計モデルリング技術を駆使して、ゲノム機能と遺伝的ネットワークの抽出を行います。
サブテーマ紹介
1. 次世代シーケンサによるゲノム関連情報の大規模生産とその情報解析手法の開発
最新のゲノムテクノロジーを駆使して超大規模ゲノム、複雑なゲノムシステム、それらに由来する遺伝子関連データを系統的かつ網羅的に生産し、生命システム原理の統合的な理解を目指した融合研究を推進します。そのために、本サブテーマでは以下の課題を設定し、サブテーマ2、サブテーマ3との密接な協力のもとに研究を進めるとともに、超大規模シーケンシングを軸として本プロジェクト以外の融合プロジェクトとも連携します。(研究代表者:藤山秋佐夫〔遺伝研/情報研〕))
- 超大規模ゲノミクス:大容量ゲノムデータの生産と処理を実行するための次世代型大規模ゲノム配列解析パイプラインを構築し、サブテーマ2、サブテーマ3に関わる遺伝的に多様な系統群のゲノム配列データ、発現遺伝子情報データを生産します。これらのデータの多様性解析法開発、データの重層化などをサブテーマ2、サブテーマ3と共同で行うと共に、データを可視化し、インターネットを通じて研究コミュニティーに公開します。
- ゲノム機能領域の先端ゲノミクス:遺伝子領域に加え、セントロメア領域、テロメア領域等、構造が複雑で従来のゲノム研究では解析が行われず取り残されていた重要なゲノム機能領域や、ゲノム複製、遺伝子発現調節・個体の発生調節とエピジェネティック制御等の基本的生命現象を解明するためのゲノム解析を大規模に実施し、それらのデータを統合的に解析する手法の開発を分野融合的に推進します。
2. 大量ゲノム関連データと多元的な生物表現型多様性データの統合による遺伝的相関構造描出のための統計手法の開発と最適化
相関解析、回帰分析、並べ替え検定、ロバスト推論、影響分析、グラフィカルモデル、多重性調整、その他さまざまな確率・統計モデルを連関解析、QTL解析、eQTL解析、遺伝子ネットワーク構造同定、遺伝子多様性解析の文脈で発展させることを目指します。具体的には以下の課題があります。(研究代表者:栗木哲〔統数研〕)
- 分散の同等性検定
- ゲノムデータにおける相関を考慮した多重性調整手法の開発
- 遺伝子情報と発現データのためのグラフィカルモデルの開発
- ヒトゲノム配列の多様性解析における方法論の整備・近接するQTLの回帰分析を用いた解析法の確立
- 高次元説明変数の次元圧縮を予測目的に合わせて行う方法
3. 大量で多元的なデータの情報・統計手法を適用したゲノム機能と遺伝的ネットワーク抽出
遺伝研で独自に開発、収集した、マウス、ゼブラフィッシュ、ショウジョウバエ、イネは、多様なゲノム情報、表現型情報を包含する貴重な研究素材です。サブテーマ1、2で確立した情報学的・統計学的手法を、モデル生物の大量のゲノム情報と表現型データに適用して、手法の評価、さらなる改善を行い、汎用的にゲノム機能と遺伝的ネットワークの抽出を行える、「遺伝機能システム学」の基盤を展開します。(研究代表者:倉田のり〔遺伝研〕)
- マウス:野生系統、コンソミックマウス(染色体置換系統群)を用いた複雑形質の定量化、データ抽出と統計解析手法の開発。ゲノム多様性データとの相関解析
- イネ:野生イネの系統間ゲノム構造、系統集団構造の解析。発現遺伝子の変異量解析。系統からの表現型抽出、association 解析の手法改良、ゲノム多様性データと変異量間の相関解析
- ゼブラフィッシュ:多様なトランスジェニックフィッシュ系統群を用いた表現型の抽出とデータへの変換法の確立、および遺伝子型相関の検出
- ショウジョウバエ:多くの変異系統群を用いた、主に翅形態の変異の抽出法の開発、および変異遺伝子群との相関関係解析
Research View 029
ゲノム×統計学のNEXT STEP。
[遺伝機能システム]栗木 哲(統計数理研究所・教授)・藤澤 洋徳(統計数理研究所・教授)
Research View 028
データが語る”豆ぶち鼠”の大いなる帰還。
[遺伝機能システム]城石俊彦(国立遺伝学研究所副所長・教授)
Research View 009
どんなしくみで「種」が分かれるのだろう。
[遺伝機能システム]岡 彩子(新領域融合研究センター・特任研究員)
2014-04-18 国立遺伝学研究所共同プレスリリース
異なる方向に変化した遺伝子調節のしくみが、新たな種をもたらす!
[遺伝機能システム]岡 彩子(新領域融合研究センター・特任研究員)ほか
Research View 002
ゲノムが語る、栽培イネはどこから来たか。
[遺伝機能システム]倉田のり(国立遺伝学研究所・教授)