先日、DELTA代表の岡田友輔氏による
成績予想システムについての記事が日本経済新聞(電子版)に掲載された。この記事の中ではアメリカで成績予測システムが幅広く開発、利用されている大きな要因としてファンタジーベースボールブームが挙げられているが、実態はそれだけではない。ネット上では毎年予測が発表される時期になると、熱心なファン達が「このチームの予測勝利数は低すぎる、この選手の成績は高すぎる」といった議論を繰り広げる。
成績予測が弾き出されるプロセス
シカゴ・カブスは昨季95勝を挙げ、プレーオフに進出した。今季もカブスをナ・リーグ中地区の優勝候補とする向きも多かったが、成績予測システム・PECOTAが予測したカブスの今季の勝利数は80勝。.500を下回る勝率を予測され、カブスファンは憤慨した。
さらにその怒りはチーム内にも飛び火した。春季キャンプにおいてチームは、クラブハウスに張り出された予定表の端に80勝82敗とプリント。奮起するためのモチベーションとしたようだ。このように予測システムはファンだけでなく、現場のレベルにまで幅広く親しまれている。どうやらアメリカではメキシコ系移民よりも予測システムのほうが簡単に市民権を取得できるようだ。
冗談はさておき、今回はその成績予測システムについて掘り下げたい。主要な予測システムとして知られているのはBaseball Prospectus(以下BP)のPECOTA、FanGraphsのZiPS、Steamerなどである。ここではPECOTAを例に成績予測の仕組みを紹介する。
PECOTAはPlayer Empirical Comparison and Optimization Test Algorithmの頭文字をとった言葉(バクロニム)である。開発者のネイト・シルバーによれば、1980年代後半から1990年代前半にかけて主にロイヤルズでプレーしたユーティリティープレーヤー、ビル・ペコタの名前にあやかったとのことだ。2003年に登場したあと、しばらくはシルバー本人が運用、改善を担っていたが、2010年に彼の手を離れ、現在はBPのスタッツチームがその全権を握っている。
個々の選手のプロジェクションは、その選手の近年の成績、リーグと本拠地の得点環境、エイジングカーブ(年齢曲線)、さらには成績の推移が似通った過去選手の成績などをもとに弾き出される。
ただPECOTAによる個人の予測値は、出場機会に限りがあることを考慮していない。そのため全選手の成績をあわせると、リーグ全体で1シーズンに記録される打席数を大幅に上回ってしまう。そこで全選手の予測値に出場機会の推測をもとに調整を行う。それにパイサジェンパットと呼ばれる計算(Pythagenpat。簡潔にいえば、ピタゴラス勝率の改良版)を用いてチームの総得失点を予測。これをもとに算出されたのが予測勝率と順位表というわけだ。
プロジェクションを考えるうえで重要な「パーセンタイル」
さて、ここからが本題だ。ここでは菊池雄星(マリナーズ)の2019年の予測を例にとることにする。開幕前、PECOTAは今季の菊池が148 2/3イニングを投げ、139奪三振、51与四球、防御率4.21、1.5のWARP(BP版のWAR)を残すと予測していた。この成績をどうとるかは読者の皆さんに判断をゆだねるが、実はプロジェクションはこの予測値だけを算出しているわけではない。どういうことだろうか。
BPは購読者に対して、他の選手との近似値やブレイクする確率など、より詳細な予測を公開している。そしてその中にパーセンタイル値というものが含まれている。このパーセンタイル値が今回の最重要ポイントだ。
パーセンタイルとは、パーセントと似た言葉だけあって統計用語のひとつである。パーセントが率や割合をあらわすのに対し、パーセンタイルは「データを大きさ順にならべて100個に区切り、小さいほうからどの位置にあるか」をみたものだ。例えば子ども50人を背の高い順に並べた場合で考える。この中で10パーセンタイルにあたるのは5番目に背の低い子ども、50パーセンタイルにあたるのは25番目に背の低い子どもといった具合だ。
ご存知の通り、野球は選手本人がコントロールできない些細なファクターにより結果が左右される。詰まった当たりが野手の間に落ちるかどうか。本来であればウォーニングトラックどまりのフライが風によりフェンスを越えるかどうか。これらの要素をすべて考慮してズバリこれ、という成績を予測することは不可能だ。
そこで重要なのが、不確定要素が与える好影響と悪影響をそれぞれ把握し、複数のシナリオをつくることだ。例えば菊池の例でいえば、多くの試合で捕手を務めるであろうオマー・ナルバエスの捕球技術が向上するかどうかは大きなカギになる。ナルバエスは昨季、BPのフレーミング評価において、フレーミング機会が1000回以上あった捕手82人のうち76位と低迷した。彼が今季も際どい投球をボールに見せるような捕球を続けるようだと、菊池の成績に悪影響を与える可能性は高い。一方で今季プレーオフ争いをするとみられている同地区の2球団、エンゼルスとアスレチックスが失速しトレード・デッドラインで主力を放出した場合、彼らと対戦する後半戦の数試合で好成績を残しやすくなるだろう。
PECOTAはこのような好影響、悪影響によってどのようなシナリオが考えられるかをすべて計算し、パーセンタイル値10区切りの予測値を発表している。菊池の例でいうと、90パーセンタイル、すなわちほぼすべてが上手くいった場合は166 1/3イニングで防御率3.29、奪三振156、与四球49、WARPは3.3を残すと予測されている。逆にシーズンを通して不遇の事態に見舞われ続けた場合、131イニングで防御率5.21、123奪三振、52与四球、WARPは-0.3とリプレイスメントレベル以下の数字が出ている。前述した1.5 WARPは、これらの中央値をとった数値だ。別の言葉に置き換えるなら、「最も可能性が高いシナリオ」といっていいだろう。
大谷翔平のプロジェクションは間違っていたのか?
もうひとつ例を挙げたい。2018年の開幕前、PECOTAの「最も可能性の高いシナリオ」は打者・大谷翔平がルーキーシーズンに214打席で.269/.333/.456、8本塁打を残すと予想していた。大谷がこの予測値をはるかに上回る成績(.285/.361/.564、 22本塁打)を残し、アメリカンリーグの新人王を獲得したのは皆さんもご存知の通りだ。
だが、この予測値は本当に見当違いだったといえるだろうか。このときPECOTAの90パーセンタイル値は271打席で.314/.384/.537、12本塁打という予測を残していた。実際に残した成績と比べると、出塁率を少し高めに、長打率を少し低めに見積もってはいるが、総合的な貢献度の予測としては十分なものといっていいだろう。本塁打が10本少ないのは、投手としての故障によって野手としての出場機会が思いがけなく増え、100打席以上多くの打席に立ったことに起因する。大谷は昨季、オープン戦で極度の不振に陥り、開幕直前に打撃フォームの改造を行った。ギリギリのタイミングでアジャストに成功したのだ。これがうまくいった場合のシナリオであったことを否定する人は少ないだろう。
過去の成績をもとにプロジェクションを弾き出すPECOTAにとって、適切な比較対象がいない大谷はかなり厄介な存在だったはずだ。それでも「すべてがうまくいった場合」のシナリオを予測することには成功したといってもいい。
PECOTAの開発者・シルバーはもともと匿名の政治アナリストとして活動していた。2008年には政治分析ブログFive Thirty Eightを開設し、正体を公表。同年の大統領選では独自の予測システムを用いて全米50州中49州の開票結果を的中させ、一躍時の人となった。その4年後、2012年の大統領選では見事に全50州の開票結果をすべて的中させ、押しも押されもせぬセレブリティーに上りつめている。
そんなシルバーだが、2016年の大統領選では苦戦。結果的に勝利したドナルド・トランプの勝利確率を、選挙日直前に28.6%と低く見積もっていたことで批判を受けた。しかし他の媒体の選挙日直前の予測に目を向けてみると、ニューヨーク・タイムズはトランプの勝利確率をシルバーの約半分の15%と見積もっていたし、ハフィントン・ポストに至ってはわずか1.7%と、ヒラリー・クリントンの勝利確実を宣言したも同然だった。シルバーの予測システムは他のメディアと比べると最も正確な予測を行い、はるかに善戦した。もっともこの場合は「すべてが最悪な方向にいった場合」のシナリオが現実になったわけだが。
フルタイムの二刀流選手と政治経験皆無の大統領候補。どちらも前例のない特異点的な存在の2人に対して、シルバーが開発した予測システムは大健闘したといえる。予測システムが弾き出す数字は絶対的な値ではない。起こり得るすべてのシナリオの中央値であり、実際の成績はそれを上回りも、下回りもする。その「最高のシナリオ」をはるかに上回るブレイクを見せる選手も中にはいるが、そのときは予測システムを批判するよりも、思いがけない成長を遂げた選手を称賛したい。