Science Report 044

デジタル・ヒューマニティーズがもたらす
「新たな知の創出」とは

様々な物事がデジタル化される昨今では、ビッグデータやAIという言葉がもはや一般的な用語となりつつある。このデジタル化の波は、今や“文系”の研究にも着々と浸透しつつある。日本の人文学研究を支える拠点では現在、デジタル化によってどのような変化が生まれているのか。そして、デジタル化が進むことによって人文学研究の将来にどのような進展を見据えているのだろうか。デジタル・ヒューマニティーズによる新たな知の創出について、 人間文化研究機構 木部暢子機構長にお話しを伺った。

Twitter Facebook
木部 暢子 機構長(人間文化研究機構)

答える人:木部 暢子 機構長(人間文化研究機構)

きべ・のぶこ。人間文化研究機構機構長。1955年生まれ、福岡県出身。九州大学大学院修士課程修了、博士(文学)。鹿児島大学教授、国立国語研究所教授を経て2022年から現職。専門は言語学、日本語方言学。著書に『そうだったんだ日本語 じゃっで方言なおもしとか』(岩波書店)、『西南部九州二型アクセントの研究』(勉誠出版)、『方言学入門』(共著、三省堂)、『方言の形成』(共著、岩波書店)、『日本語アクセント入門』(共著、三省堂)など。


「人文学」研究と、財産としての“資料”

我が国には現在、4つの「大学共同利用機関法人」が存在する。そのうち自然科学研究機構、高エネルギー加速器研究機構、そして情報・システム研究機構の3組織は主に理系分野を中心とした研究を支えているが、唯一文系分野を中心とした研究を支えているのが人間文化研究機構だ。人間の文化や社会についての知を深める「人文学研究」を支える拠点である人間文化研究機構は、佐倉市にある国立歴史民俗博物館(歴博)、立川市にある国文学研究資料館(国文研)と国立国語研究所(国語研)、京都市にある国際日本文化研究センター(日文研)と総合地球環境学研究所(地球研)、そして吹田市にある国立民族学博物館(民博)の6機関から構成されている。「自然科学は生命や地球・宇宙の理など人間の外側にある原理を究明する学問ですが、人文学は自然の中で暮らす人間がどういう歴史の流れの中でどんなことを考えて、どんな繋がりを持った社会を構築したのか、そこでどんな暮らしをしたのかを考える、人間に関することを研究する学問です。ただ、もちろん人間は周囲の環境から切り離されて生活しているわけではないので、理系領域の学問ともつながっています」と、木部機構長は話す。

そもそも大学共同利用機関とは、個々の大学では整備や維持が困難である最先端の大型装置や大量の学術データ、貴重な資料や分析法などを全国の研究者に提供することで、様々な研究分野において「国内外の研究者が共同で利用できる場」を提供し、各大学の垣根を越えた研究の推進を図ることを目的として設置された組織だ。中でも人文学研究を進める人間文化研究機構の各機関において重要になるのは、多種多様な「資料」の共有である。文献資料や歴史的に貴重な資料などの有形のものばかりでなく無形の言葉や文化財、さらには地域環境に関わる膨大な資料が、人文学研究を進めるための血となり肉となっていく。

デジタル技術の掛け合わせが可能にすること

人文学研究にとって必要不可欠な有形無形の資料だが、それ故の課題があったと木部さんは振り返る。「歴史資料や文献資料、言葉や祭りの音声資料や動画資料などは、これまで簡単に探したり、目に触れられたりするような形にはなっていませんでした。例えば自分が調査している地域や年代の資料を他の地域や年代のものと比べようと思っても、資料がアナログであるために簡単に検索したり、比較したりする術がこれまであまりなかったんです」。そこで登場する取り組みこそ、シンポジウムの講演タイトルにもなっていた“デジタル・ヒューマニティーズ”だ。

「デジタル化された資料が公開されていれば、知りたいときにいつでもすぐ見ることができます。今では当たり前のように思うかもしれませんが、この作業が人文系の研究分野では遅れていたんです。しかし近年のデジタル技術の発展は凄まじいですよね。最近では一般の人が簡単にいろんなお祭りの画像をYouTubeに投稿しています。国立国会図書館でも昔の資料をPDFや写真にして公開しているものがありますし、国立国語研究所では言語資源をコーパスという形で音声付きの検索ができるようにしたり、膨大な量の書き言葉が検索できるようなシステムを組んで公開したりしています。こうして大量のデータを検索することができるようになれば、これまでは同時に付き合わせて比べることができなかったような資料が、並べて見られるようになるわけです」。これまでもデジタル化は行われていたものの、専門的な処理を行うためには多くの時間と人手、そして費用が必要だった。しかしデジタル化に関する作業は、昨今これまでとは比べ物にならないくらい簡単にできるようになってきている。だからこそ、人文学に関わる大量のアナログ資料をデジタル化しビッグデータとして扱うことで新しい知見を生み出そうというデジタル・ヒューマニティーズに、期待が高まっているのだ。

デジタル・ヒューマニティーズ推進に向けた課題

歴史的な書物や文献、文化的な行事の様子、地方の貴重な方言やアクセント、言い回しの肉声データなどを文字や画像、音声や動画の情報としてデジタル化して残すこと自体は、今では決して難しいことではないだろう。しかし、まだデジタル・ヒューマニティーズを進めるための課題は多く残されていると木部さんは考えている。「地方には、デジタル化されていない資料がまだたくさん眠っています。例えば昔、庄屋さんだった家の蔵の中にある物品の中には江戸時代の文書や日用品など、当時の文化を残す資料が少なくありません。しかし蔵の所有者からすれば、それが何かがよくわからず、先祖代々の思い出の品だというくらいのことにとどまってしまい、歴史的・文化的な価値があるものだとはなかなか思ってもらえないことがあるんです。そうこうしているうちに蔵を取り壊すことになり、古いものは捨ててしまおう……、となりかねません。そうならないように、蔵の中の古いものには文化的な価値があることを伝えていかねばなりません。デジタル化を進めるにあたって、まずは残すことの価値を知ってもらう必要があります」。

また、デジタル・ヒューマニティーズを進めるためには、ただ資料をデジタル化するだけではなく、その資料が何ものかを示すためのタグをつける作業が非常に重要になる。その資料がどこで、誰が、どのように使っていたものなのか、またどのような経緯で作られたものなのか。このような資料の価値を判断するために必要となる情報は、元あった場所からひとたび散逸してしまうと、後では追うのが難しくなってしまうのだ。「資料そのものについての学術的な情報や資料を特徴付けるメタ情報は、やはり専門家でないとつけていくことができません。資料の所有者と、その地元の博物館、そして研究機関が協力関係を結んだ上でデジタル化やタグ付けの作業を進めていく必要があります」。

これまでも、全国にある博物館のネットワークを使って国立歴史民俗博物館や国立民族学博物館などでは各地の資料を調査し続けてきている。しかし、まだ全然手が足りていないと木部さんは説明する。「現存する資料は膨大な量です。また、国内にはたくさんの地域があります。私たちがこれまで保存してきたのはごくほんの一部にすぎません。地方には、その地元で活動する研究者もいれば、教育委員会の職員、文化施設の学芸員、それから地域文化に関するNPO団体を経営している人もいますよね。そういう方たちと協力して活動を進めていかないと、いくら手があってもまだまだ足りない状況にあります」。

“文系”に閉じない協力体制の重要性

人文学資料をデジタル化し、活用する取り組みであるデジタル・ヒューマニティーズは、資料のデジタル化の部分に光が当たりがちかもしれない。しかし、本当に力を入れたい取り組みはその先にあると木部さんは話を続ける。「デジタル化は力仕事ですから、たくさんの人が参加すれば進みます。しかし、大事なのはそのデータから何を生み出すかなんです。集めたものをいろんな角度から、いろんな視点で見てみたら、今まで分からなかった何かがわかるという、新たな知の創出が重要なんです」。それぞれの資料の専門家だけでは気づけなかったようなことが、デジタル化された資料を他の専門分野の人が見ることで見つかるかもしれない。これまでは偶然にすぎなかった学術的なセレンディピティを、データを探しやすく、見やすくし、そしてデータに触れやすくすることでより効率よく生み出そうというのが、デジタル・ヒューマニティーズの真骨頂なのだ。「だからこそ文系の研究者だけでなく、これからはもっと理系の研究者とも協力した方がいい。多様な分野の人たちが同じ資料を見て、それぞれの専門領域から『これはこうじゃない?』と言い合うことが大事だと思うんです」。

誰でも専門的な資料を理解できるように

人文学研究と理系分野の研究の接点は、今後ますます増えるだろう。人文学資料の中には、これまで知られていなかった自然科学的な情報も含まれているからだ。「例えば、古い時代の記録書や公卿の日記の中には、天気や地震の情報も含まれています。この資料を元にして、地震のサイクルを知ろうという研究もあります。現在、デジタル化されているものは京都付近の資料が多いのですが、他の地方の人もたくさん日記を書いているわけで、そういうものはまだ全然デジタル化が進んでいません」。当時の花の開花や降雪などの情報を日記から読み解くことができれば、地方ごとに今と昔の気候の違いだって解析できるかもしれない。今でいうところのTwitterやブログの投稿解析のようなことが、全国各地に存在する歴史的な文献から可能になる日が来るかもしれないのだ。そのためには、専門外の人でも資料が見られるようにならねばならないだろう。ここでもデジタル技術が大きく活躍すると木部さんは説明する。「例えば、いくら昔の文献が見られるようになっても、当時の“くずし字”を読める人は今や専門家以外にほとんどいません。そこで国文学研究資料館と情報・システム研究機構が共同で開発を進めたのが、AIくずし字認識アプリ『みを』です。これでくずし字が活字として誰でも読めるようになりました。でも読めたとしても、当時と今では単語や文法が違うので、まだ意味が通じないかもしれません。次はこれが自動で現代語訳できるようになれば、誰でも内容が理解できるようになるでしょう」。

デジタル・ヒューマニティーズの進展には、専門家に閉じない多様な人々の参画が不可欠だろう。そのためには、専門家と社会の人々との壁を取り除く作業も進めていく必要がある。最後に木部さんは、こう締めくくった。「令和4年度に日本語学会で、中高生向けに日本語の謎を探究するような日本語研究コンテストを行いました。多くの応募があったんですが、どれもとてもレベルが高かったんです。学校の授業では通説を答えとして教えますが、文化は多様ですから決して通説だけが唯一の答えではありません。人文学研究に関わる人を増やすためにも、私たちはもっと学生の皆さんに対して人文学の不思議や疑問を投げかけていかないといけないと思っています。そして、その探究活動の際に使いこなしてもらえるようなデジタルプラットフォームを作りたいですね」。

(聞き手:科学コミュニケーター 本田隆行 写真:飯島雄二 公開日:2023/03/30)

大学共同利用機関法人 情報・システム研究機構
〒105-0001 東京都港区虎ノ門4丁目3番13号ヒューリック神谷町ビル2階
TEL:03-6402-6200 FAX:03-3431-3070 E-mail:webmaster_sr@rois.ac.jp
Copyright © Inter-University Research Institute Corporation Research Organization of Information and Systems(ROIS). All rights reserved.