人間・社会データ 政策にも活かせるサイバーフィジカル融合社会のデータベースを構築します。

最新の成果とお知らせ

「社会コミュニケーション」の最新の成果とお知らせページをご覧ください。

データベースの必要性

成果概要

高度な情報通信技術によって、あらゆる情報機器やセンサがネットワークへ接続され、情報がデジタル化されて流通し、いつでも、誰もが、どこからでもアクセスできる社会が到来しています。この結果、情報空間(Cyber-space)と実世界(Physical-world) が連携、あるいは統合した「サイバーフィジカル融合社会(Cyber-Physical Integrated Society)」が形成されつつあると言えるでしょう。この融合社会では、実世界の現況や人と社会の活動を情報世界に映し出し、情報の力によって、人類が直面する環境・エネルギー、医療・健康、食糧問題などの対策や新たな価値創成を行うことが期待されています。そこで、人間・社会の挙動をセンシングし、そのデータを中心とした分析を行い、人やモノを制御する情報・サービスを合成し、迅速かつタイムリーにフィードバックする技術的・社会的仕組みを研究開発します。

一方、人間・社会の問題解決の難しさは、部分的でしかも不完全な情報やデータに基づいてリスクやプロフィットを推定し、主観的判断や意思決定を行うことにあります。そこで、人間・社会における合理的な意思決定や判断をデータに基づいて支援するため、急速に普及するスマートフォンやSNS、多様なセンサから収集される多種多量なビッグデータの収集、保管、共有、分析・合成を可能とする人間・社会データ基盤を構築します。

本データベースは、プロジェクト「社会コミュニケーション(コミュニケーション情報学)」との有機的連携により推進します。(プロジェクトディレクター:曽根原登〔国立情報学研究所〕)

研究開発の概要

<人間・社会データ駆動のサービス科学基盤の研究>

(研究代表者:曽根原登〔国立情報学研究所〕)

1. 人間・社会データプライバシー保護利活用基盤

携帯端末の高性能化や普及、TwitterやFacebookをはじめとするソーシャルネットワークサービスの台頭により、個人に関わる膨大なデジタルデータ(ライフログ)を含んだ様々なデータがインターネット上に蓄積されつづけています。さらには、固定・モバイルカメラから大量にアップロードされる画像や映像もある種のライフログと考えることができ、インターネット空間は、まさにマルチメディア・ビッグデータの様相を呈しています。ライフログは個人に関連するプライバシー情報であるため、これを保護しつつ、有効利用する方策が求められています。

そこで時間軸(災害時など特別な場合)、空間軸(駅・商業施設・テーマパークなど実世界における特別な場所)におけるプライバシー情報保護活用基盤を構築します。蓄積されたライフログに対して、災害時や緊急時に必要となる個人情報や属性情報の利活用が困難になっており、東日本大震災では、迅速な避難・救助活動の阻害要因のひとつとなりました。このため、災害時や緊急時において、通信を介して個人情報を利活用できる情報システムが求められています。

時間軸におけるプライバシー情報保護活用基盤として、行政や民間と個人のライフログデータを連携させて一元管理し、ライフログ利用が自律的に地域分散で判断処理できる情報システムを研究します。これにより、個人情報保護法制の壁を突破し、具体的なサービスとして、個人情報や個人属性情報を用いて、被災地のどこに誰が住んでおり、その人は子供か大人か、手助けのいる人か、あるいは寝たきりなのか、さらには、日本語が分かるか、などの個人情報を連携させ、適切な救援や救助計画を素早く策定する方法を実現します。

一方、空間軸におけるプライバシー情報保護活用基盤については、プライバシー情報の中でも人間の内面的な情報(趣味、嗜好、行動傾向、購買傾向など)を積極的に開示可能な特別な場所において、ソーシャルメディアとセンシングデータの融合、プライバシー保護のためのデータのクレンジング、時空間データベースの構築とマイニング、情報活用・情報推薦の手法を要素技術とし、ユーザのプライバシー情報の開示とユーザの得る利得がマッチする調和的情報フィールドを空間軸でのプライバシー情報保護活用基盤として構築します。

本研究の学術的目的と意義は、人間・社会データ基盤を実現する上で、解決が不可欠となるプライバシー情報の保護と開示問題を考え、このバランスを情報システムとしてどのように与えていくかという点にあります。これは「よいサービス、有益な情報を受けようと思えば、自分の情報を差し出さねばならない」といういわば自然な発想を、情報学、統計学、社会科学が融合した科学的な枠組で実現しようと試みるものであり、特に時間軸と空間軸に分けて、相互の関連や相違点を明らかにすることは新しい視座と言えるでしょう。プライバシーという社会心理的な対象を扱うことで、情報科学、統計学、サービス科学、社会科学の界面が大きく拡大します。

具体例として、たとえば災害時に特定の地域に対して、被災者のプライバシー情報を積極的に開示するといった、時間軸と空間軸が相互に関連するなかで、ユーザのプライバシー情報開示をユーザ自身が制御する基盤の構築を試みています。これは時空間におけるプライバシー情報の保護活用という、新しい情報流の萌芽となるものと言えるでしょう。このようにして、ライフログなど個人と係わる情報や属性情報の収集、管理、分析、利活用に関して、利用者が個人情報の取り扱いを自ら決定する仕組みとしての「IDデータコモンズ」を構築します。そして個人・民間・行政の保有するデータを連携させ、大事故や社会危機などいわゆるクライシスと呼ばれる事象に対し、強い社会基盤の実現を目指していきます。

2. 人間・社会コミュニケーションデータ収集基盤

社会科学の理論の多くは社会現象の説明については有効である一方で、どのように社会を変えることができるかという介入的な方法論については、多くの示唆を与えません。一方、情報学は社会に対して工学的にアプローチするものの、それがどのような理論的意味を持つのかについて説明力を持たず、またその効果の検証も脆弱だと言えるでしょう。

このような社会科学と情報学の間に横たわる空隙を埋め、社会科学的理論に基づいた情報学的アプローチによって、新たな社会的価値を学術的に創出することを目指します。このため、スマートフォンを活用した人間・社会コミュニケーションデータ収集基盤を開発し、従来の社会科学的方法論では不可能であった測定と社会的介入研究を行います。具体的には、スマートフォンでのコミュニケーションログデータを活用した測定方法論の提案、社会ネットワーク理論をベースにした社会関係資本の生成基盤の実証研究において成果を上げています。

また応用可能性の高い人間・社会コミュニケーションデータ収集基盤の特徴を生かし、新たな社会的価値の創造に挑みます。特に、スマートフォンのログからユーザのコミュニケーションスタイルを推定し、そのスタイルにカスタマイズした形での特定の行動促進メッセージを刺激として送信することで、その効果を検証します。これは、社会科学における行動理論と情報学的方法論の融合を通して、学術的にも新たな領域を切り開くものと言うことができるでしょう。

3. 人間・社会データ分析サービス合成基盤

情報空間と現実世界が連携、統合した「サイバーフィジカル融合社会」をより良いものにするには、現実世界の情報を情報空間に投影して分析し、その結果を人やモノにフィードバックすることで新たな価値を創り出す、データ駆動によるサービス合成科学の創成が必要です。

現在、サービス性や経済性などの科学的根拠が希薄な政策や意思決定の多くは、期待された効果が得られず、持続的運用などに大きな課題を残すことが社会問題となっています。この問題を解決するには、客観的根拠データに基づいて政策決定や意思決定を行う必要があります。これには、スマートフォンなど携帯通信端末を利用し、社会参加、生活やコミュニケーション活動などの行動履歴の記録情報(ライフログ)の利活用が有効です。しかし、ライフログを収集し利活用するには、利用目的の通知と開示者の同意が必要となるため、同意処理のコスト、個人情報管理の情報セキュリティコスト、さらには法令違反の恐れなどのコンプライアンスコストが増加し、新たな情報サービスの誘発や合理的な意思決定を妨げています。

実際、先の大震災では、災害時に必要となる個人情報や属性情報の収集、利活用をしにくくし、迅速な避難・救助活動の阻害要因の一つとなりました。法制度としては本人の同意を得ることが困難で、なおかつ生命、身体、財産が脅かされている場合に限っては、本人の同意を得ることなしに個人情報を取得してもよいことになっています。しかし、大震災など緊急時の現場においては、通信機能の消失や行政機能の停止などが生じることもあり、個人情報の利活用を素早く決定できるとは限らりません。

そこで、ライフログの収集、管理、共有、分析、合成に関して、その取り扱いを自ら決定する仕組みとして「IDデータコモンズ(Identity Data Commons)」を実現します。IDデータコモンズは、個人情報の種別毎に、(1)発災後の開示期間、(2)開示先もしくは開示目的の限定、(3)救助・救援などへの直接利用と被災統計などへの間接利用の可否について、条件付きでオプトインする仕組みです。さらに、平常時に利用している情報サービスに登録されている個人情報や、公的機関などが有する個人情報について、災害対応に限定して事前に意思確認を行っておくことで、新たに個人情報を収集する必要はなく、災害時に限定した情報開示への同意であることから心理的ハードルも低くすることができます。また平常時の情報サービスの魅力や、災害時の減災力向上というメリットから一般市民が同意する十分なインセンティブが存在します。

<人間・社会データ収集・利用加速の基盤整備>

(研究代表者:椿広計〔統数研〕)

4. 政府公的統計のオンサイト拠点形成と全国展開計画の整備、オンサイト拠点データのアジアデータへの拡張

人間・社会データ中心科学を推進するための高品質な政府情報のデータ基盤整備を目的としています。このために、政府統計部局、独立行政法人統計センター、公益財団法人統計情報研究開発センター、日本学術会議第一部国民視線の統計分科会との連携関係を一層強化し、全国の匿名化拠点などとの連携を基にデータ基盤整備、並びに、政府情報の研究者利用の推進に資する環境を整備します。

このため、平成22年度に実現した統計センターとの連携協力に基づく公的統計匿名化データ提供拠点を発展させ、既に平成23年度に整備・認可されたオンサイト解析室が、わが国の公的統計データの導入のみならず、統計情報研究開発センター伊藤理事長が平成25年1月にアジア10か国の統計局長と交わした覚書に記載され、文科省も承諾したアジア公的データ利用の拠点としての役割も果たすべく、アジア12か国の公的統計データの個票を分析可能な拠点として形成構築を目指します。

長期的には、日本学術会議大型設備計画に、平成25年3月に第一部から統計センターなどと共同提案する予定の、統計センターと全国の人間・社会科学系大学学部などとを専用ネットワークで接続し、公的統計情報のリンケージ、探索的データ分析並びに高度なモデリングがオンサイト拠点を全国展開する計画の精緻化を図ります。なお、平成26年度には、現在構築中のオンサイト拠点を活用して、国立精神・神経医療研究センターの委託を受けた自殺統計の開発も行う予定です。

5. 産官も活用可能なデータベース構築とその利用を前提にした共同研究の企画

産学官の共同研究に資する可能性の高い3つのデータベース提供を将来の目的として、基盤整備を行います。

第1のデータベースは、一般社団法人CRD協会の保有する企業財務データを基に、CRD協会からの外部資金提供も受けながら「中小企業財務データベース」の構築を継続します。このデータを直接的に利用する共同研究実績を積み上げるために、中小企業のクレジットリスクとその管理に関する共同研究も、統計数理研究所公募型共同研究などを通じて行います。

第2のデータベースは、情報循環を加速する管理技術(統計的方法に限らない)をクラスター化した標準的構造体として所収するデータベースと、その方法が産官で利用される標準的研究開発プロセス(ISO TC69 SC8のみならず、さまざまなプロセスモデルを統合)のマイルストーンからも検索可能なデータベースの構築です。このデータベースを開発するために産官学の開発研究者のネットワーク「VCP-NET」を平成25年5月末に(財)日本規格協会の協力の下、開始します。

第3のデータベースは、レセプトなどからなる健康科学データに関わる情報基盤です。研究所のオンサイト拠点が形成されたことにより、平成24年度に一時的にオンサイト拠点で利用可能となった厚労省レセプトサンプリングデータを利用した研究企画を島根大学医学部などと常時行うことで、毎年サンプリングデータが定常的に格納され、共同研究に資する環境を実現することを目指します。さらに、平成25年度は、これまでの医薬品安全性研究に加え、一般社団法人国際栄養食品協会が提案している、機能性食品による失明予防の医療経済効果測定を、研究所が保有する民間最大のレセプトデータベースを活用して、その実現可能性に関わる初動的検討を島根大学医学部と共に行います。本データ基盤を利用した研究については、上記法人を通じて厚生労働科研費などの企画につなげていきます。

6. 産業環境情報のアジアでの収集と還元プラットフォームの実効化

大阪大学の協力と、社団法人産業環境管理協会のデータ提供を基に開発したeL-Platformを用いて、アジア、特にインドネシア技術評価庁(Badan Pengkajian dan Penerapan Teknologi: BPPT)との連携を基に、アジアの産業環境情報を収集し、研究可能なデータの蓄積を開始します。地域から収集した分析結果を収集に協力した自治体(ボゴール市など)や企業に還元する活動を開始。また、現地で情報収集に協力する研究者に対して必要な研修事業を行います。

データベース開発の推進体制

国立情報学研究所と統計数理研究所を中心とし、全国の29大学(東京大学、大阪大学、同志社大学、広島大学、高知大学、東京学芸大学、和歌山県立医科大学、慶應義塾大学、電気通信大学、九州大学など)と連携します。また災害に学ぶ重要な人間・社会データの分析や収集・管理・共有の方法を確立するため、東日本大震災の被災地の4大学(東北大学、石巻専修大学など)や地方公共団体9機関との連携を強化しています。さらに、観光、防災・減災、環境政策科学においては、地域の政策主体である自治体(仙台市、京都市、広島県・広島市、山梨県、高知県など)および産業界と連携し、産官学連携によるデータ中心政策決定支援サービスの社会実装を実施します。

関連記事

Research View 022

データが生む知見で、よりよい社会へ舵を切る。

[人間・社会データ]山下智志(統計数理研究所・教授)

リサーチコモンズの「社会コミュニケーション」と「人間・社会データ」にまたがる研究を推進する、統計数理研究所 リスク解析戦略研究センター長の山下智志教授。

Research View 016

統計データを社会に活かす未来像。

[人間・社会データ]椿広計(統計数理研究所副所長・教授)

1947(昭和22)年に公布された統計法が、2009(平成21)年4月、およそ60年ぶりに大改正されました。「統計」を意味する「Statistics」は、まさに国「State」の状態、すなわち国勢を知ることによって国を動かす指針にする「国勢学」がその語源です。