感染症は都市でどう拡がるだろうか。

「データ同化・シミュレーション支援技術」のプロジェクトで活躍する齋藤正也特任助教(統計数理研究所)。インフルエンザなどの感染症が都市部でどう拡がるのか、「データ同化」という手法を使って、その予想に取り組んでいます。最新の統計手法のひとつと言える「データ同化」を、感染症の拡大という具体的なテーマに応用すると、私たちの生活にどのように役立つのか、またどんな難しさがあるのか?──日々進化を遂げつつある研究開発の現況をご紹介します。

そもそもデータ同化とは?

データ同化でパンデミックに備える

2009年に起こった新型インフルエンザの大流行を、ご記憶の方もきっと多いことでしょう。同年6月には世界保健機関(WHO)から「世界的流行病」宣言が発表され、日本でも「パンデミック」という言葉が一気に広まりました。われわれはこの問題に何か対策できないだろうかと考え、当時から交流のあった東京大学医科学研究所のグループと議論を始めたんです。この新型インフルエンザウイルスは、日本ではまず関西地方で流行し、その後東京で感染者が見つかる、という経過を辿っていました。このようなウイルス拡大への介入策として、当時は、たとえば大阪ー東京間の電車の全面運休もやむを得ないのか? といった議論もありました。そこでわれわれは、電車を止めずに、ワクチンをうまく活用して拡大を緩和する可能性を探ることにしました。また、もし都市から都市へ感染することが予測できれば、自治体個別の対策ではなく、共同で取り組む必要性を示唆できます。そこでこのための感染予測シミュレーションをつくったのが、本研究のきっかけでした。

2つの不確定性により推定に時間がかかる

感染症データの難しさは、まず実験によって現象を再現することができず、情報が極めて限られている点です。そして人が接触したからといって、必ずしも感染や発病が起こるわけではないという不確定さがあります。このような2種類の不確定性があることから、いろいろな場合を想定した複数のシナリオをシミュレーション計算に加える必要があり、するとスパコンを1日以上駆動してやっと予測できるような計算量になります。データ同化という手法は、このように取得できる情報量が限られていたり、複数の可能性を並行して追っていかなければならないような場合に、威力を発揮してくれます。

「適当にどこか」を再現するには乱数が利く

一方、設定をごく簡単にして、鉄道でつながっている3つの町に、それぞれ会社・学校・家庭・公園などがある場合を考え、通勤・通学などで人がゆききしながら、感染がどう拡がっていくかを可視化した動画も作成しました。このようなシミュレーションでは、一人一人の動きを逐一記述せず、たとえば電車が混んでいる状態とか、週に約2回公園へ行くといったおおよその動きを、乱数を使って再現します。感染についても、人が接触しても感染したりしなかったりするけれども、全体としてみれば一定の確率で感染しているので、同様に乱数を使って感染拡大の様子を構成しています。このシミュレーションを使って、たとえば会社員全員にあるタイミングでワクチン接種したら、いかに効果的に感染緩和できるかといった予測も行っています。

実データを使ってより具体的な予測を実現する

このような予測ができるようになってきたものの、このシミュレーションにはまだ、実際の感染者に関する調査結果が反映されていません。そこで実データにぴったりと合わせるデータ同化の手法を、現在模索しています。またこの際、会社や家庭といった項目よりもやや抽象度の高いモデルを使うことにより、予報に使えるようなシステムが組めるのではないかと考えています。そして最終的なゴールとして、たとえば東京ー大阪間を行き来する感染者数などのデータに基づき、たとえば来週どれだけ感染者が増えるかといった予想につなげていきたい。2009年にはいわゆる水際防衛という政策が採られましたが、感染には潜伏期間の問題があり、のちに感染症の専門家が、最悪の場合で感染者の9割が防衛をすり抜けてしまうという研究結果を出しました。このような場合、統計が活躍したはずであり、今後は、政策決定やひいては人々の生活に使える道具をつくるために、がんばっていきたいと考えています。

統計に関する書籍を広範に集め、広く一般に供している統計数理研究所図書館にて。大学・研究者の閲覧はもちろん、一般の方々にも公開している。

(文:齋藤正也・池谷瑠絵 写真:水谷充 公開日:2014/05/20)