スポーツを統計の知で応援しよう。
答える人:田村 義保特任教授(統計数理研究所)
たむら・よしやす。兵庫高校出身、理学博士(東京工業大学)。1986年統計数理研究所助教授、1997年同教授を経て、2018年より現職。統計的手法の研究開発と、その実社会へのさまざまな応用に取り組む。同研究所の大学共同利用機関としての役割から、シミュレーションに不可欠な物理乱数発生装置の研究開発でも知られる。
答える人:酒折 文武准教授(中央大学)
さかおり・ふみたけ。中央大学理工学部数学科准教授、博士(理学)。専門は統計的モデリング、計算機統計学、スポーツ統計科学、統計教育。立教大学社会学部助手、中央大学理工学部専任講師などを経て、2009年より現職。統計数理研究所客員准教授を兼任。
答える人:竹内 光悦教授(実践女子大学)
たけうち・あきのぶ。実践女子大学人間社会研究科教授、情報センター長、博士(理学)。専門は、統計科学、行動計量学、統計教育。日本統計学会統計教育委員会の長として、長く統計的思考力を育成する統計教育に取り組み、またデータサイエンス教育への情報端末の活用、学外イベントを活用したアクティブ・ラーニング、統計教育へのゲーミフィケーションの導入、公的統計を利用した授業開発等を推進。
ただ単にすべてのスポーツが好きだから。
2018年3月19日、東京都立川市にある統計数理研究所にて、日本統計学会、情報・システム研究機構統計数理研究所等が主催するシンポジウム「スポーツアナリティクスと統計科学(第7回スポーツデータ解析コンペティション受賞者講演会)」が開催された。そもそもこのコンペは、株式会社データスタジアム提供によるデータを用い、野球、サッカー、バスケットボールの3つの種目から選んで解析して、「分析」「インフォグラフィック」「中等教育」という3つの部門ごとに研究成果を競うものだ。前年の9月末に応募が締め切られ、2018年1月に最優秀賞をはじめ各賞の発表が行われた(中等教育部⾨は別スケジュールで実施)。本シンポジウムは、その表彰式を兼ね、コンペの締めくくりとして行われたものだ。
野球が好きで、大学院生の時はキャッチャーをしていたという統計数理研究所の田村義保名誉教授は、「開始当初は、データサイエンティスト協会もないし、データサイエンスという言葉もなかった」と振り返る。「スポーツを対象に統計を駆使しようと思ったのは、すべてのスポーツが好きだから。僕だけでなく、みんなスポーツには興味があるでしょう? つまり、スポーツはデータ解析の練習に最適なんです」。参加者も年々増加し、今年の分析部門には61チームの研究成果が寄せられたという。
また種目別には「野球よりもサッカーの解析のほうがいい研究が多かった印象がある」と言う。野球は1球ごとのデータしか提供されないが、サッカーはプレイデータに加え、ボールの軌跡や1つ1つのボールのタッチデータを記録したトラッキングデータがあるため、組み合わせて解析することができるためだ。「つまり、サッカーのデータの質が上がった」と田村教授。2016年のコンペでは、ラグビーを採り上げるなど、種目の幅も広げているという。難しい統計でも、スポーツとなるとなんだかわくわくして、参加したくなってくる……どうもスポーツには、そんな不思議な力があるようだ。「うれしいことに、このコンペで2回も発表したことのある学生が、日本のプロ野球選手になったという例もあるんです。データ解析のできる人材については、今や、すべてのプロ野球チームが欲しがっていると言っていいでしょう」。
スポーツのデータに触ってみるという意義
田村教授と並んで第1回のコンペから中心的に活動してきた中央大学の酒折文武准教授も、「そのスポーツを知っていれば、分析した結果から何を読み取ったらいいかわかる。その意味で、スポーツは教育的なコンテンツとして、非常に優れている」と言う。「特にスポーツ好きの人にとっては、最高のテーマなのではないでしょうか」。
コンペを通じて、とにかくデータに触れ、統計的な思考力を鍛えて欲しい──そんな主催者たちの思いは、しかし、本当に実現しているのだろうか?「やはり非常に成果があるというのが、率直な感想です」と酒折准教授。「何度も参加しているチームが、どんどん上達しているんです。どういう視点で、どういう切り口で、何を伝えたいのか。他のチームの優れた研究発表を見ることによって、統計的な考え方が洗練されてくるのだと実感します」。
審査では、まず分析テーマが魅力的であるかが問われる。「結論が意外だったとか、実用性が高い研究も評価されます。つまり、なぜその分析をしなければならないかということが大事」と酒折准教授。「次に分析手法が適切か、工夫が見られたかどうかを審査します。分析手法やその使い方に独得な点や新規性があると加点の対象になります」。与えられている変数をそのまま使うのではなく、加工したり新たなデータを取得したりするのも評価されるそうだ。
そして何より「誰に向かって提案しているのか。選手やコーチに伝えたいことなのか、あるいはチームの運営戦略なのか、それとも、そのスポーツの中継を面白くしようというメディアの目線なのかが重要」なのだという。「それがあれば、成果をどうプレゼンテーションするかも自ずと決まってきます」。
ビヨンド2020のスポーツ界へ向けて
コンペは整理されたデータセットが提供された中での競争だが、「ほとんどのスポーツは、僕らから見るとデータが充実していない、取得すらされていない状況にあります。その中でスポーツ統計がどれだけ貢献できるかは、ひとつのチャレンジだと考えています」と酒折准教授は言う。「例えば柔道のような対戦競技の試合の動画があったら、そこからいかに分析データを生み出していくかも今後の課題だと思います。しかしそれは形式が整っていない、いわゆる「非構造化データ」であるため、どうアプローチすべきかは自明ではありません。統計学の知識だけではなく、もっと情報学的な進展も必要になってきますね」。
大リーグをはじめバスケットボール、サッカー、アメリカンフットボール等々のプロスポーツが盛んな国々では、「実は、スポーツ統計専門の科学雑誌がたくさんあって、かなり研究が進んでいる」のだそうだ。「日本でも2020年以降のスポーツ振興へ向けて、スポーツチームのコンサルティングを行う会社が活動し始めています。また2014年には日本スポーツアナリスト協会(JSAA) が設立されて、年々大規模なカンファレンスを開催しており、スポーツアナリストの情報共有も活発化しています。このような状況から、10年後には、かなりゲームチェンジが起こってくることが予想されますね」。
日本人の誰もがデータで語れるように。
一方、中等教育部門は、3回目のコンペから加わった部門で、参加者は研究成果をポスターにまとめて応募する。第5回目の今回は、全国から全65もの力作が寄せられた。実践女子大学の竹内光悦教授は、開設以来、本部門を担う。
「日本人の数学の能力は、国際比較などで、その高さが認められています。でも統計について調べてみると、中国、アメリカ、韓国、ニュージランド、イギリス、オーストラリアといった、つまり日本以外の国々ではその教育がもっと進んでいる」。そこで文系・理系問わず、市民が必要な能力として統計を入れていこうと中等教育の学習指導の見直しが進められているが、竹内教授は近年、その活動にも注力してきた。「少し前の話ですが、平均という概念ひとつをとっても、日本では小・中学生の段階で、データを代表する値として中央値や最頻値を学んでいなかった。それで大人になって、国際社会における日常的なビジネスの会話についていけるのか?」と、強い危機感を訴える。
さて、今回のスポーツ統計だが、竹内教授は「社会調査のデータと違って、正規分布に近いようなきれいなデータが多い」と指摘する。「また、勝つというゴールが見やすい──しかし、なぜうまくいったのか、どの要因が一番効いているのかは、分かりませんね? そこを科学的に突き詰めていく、その考え方を統計を通じて学んでいって欲しいのです。例えばバスケットなら、シュート率が悪い原因は何か、勝つチームの傾向、負けるチームの傾向は何か……というように、いろいろな統計手法を使って見ていきます。さらに、今見えているものは表面的なものだから、別の分析によって新しい関係性が見つかるのではないかといった気付きも重要です」。
地元のバスケットチームを強くしようという香川県立観音寺第一高等学校チームのポスターは、まさにその好例だ。まず特性要因をまとめて図にし、主成分分析を使った解析やその検証などを行い、最後に提言を行うポスターで、最優秀賞を受賞した。「理系に進むにしても、文系でマーケティングや戦略立案へ行くにしても、その基礎にはすべて統計がある。このスポーツコンペの役割は、データで語れる人を育成することにあると考えています」。
(聞き手:池谷瑠絵 写真:飯島雄二 公開日:2018/04/12)