セイバーメトリクスでは、WAR(Wins Above Replacement)をはじめ、いくつかの指標で「リプレイスメント・レベル」という概念が用いられます。 意味としては「代替水準」とされています。しかし、過去のスタッツに比べても特殊な概念であるため、理解しにくいうえ、やや誤解を招きやすいものでもあります。 今回はこのリプレイスメント・レベルについて少し考えてみたいと思います。

リプレイスメント・レベルとは何なのか

リプレイスメント・レベルについては当サイトで紹介されているほか、キーワードで検索すれば解説を行っているページも出てきますが、ここではあえて簡単に解説します。

かつてセイバーメトリクスの世界において、選手の貢献度はリーグ平均からの相対評価で測るのが一般的でした。しかし、リーグ平均成績は選ばれた一部の選手の出場成績が大部分を占めているため、これを0と定めると問題が生まれます。

リーグ平均を0(=無価値)であるとするなら、2019年のNPBの平均OPSは.716くらいでしたが、それではフルシーズン出場してOPS.716の選手の評価は0が正しいのでしょうか?あるいは、規定イニングを投げてリーグ平均に近い防御率3.90の投手も同様に無価値だったと判断すべきなのでしょうか?何となく違和感を覚えるはずです。

そこで、何を基準にして判断すれば良いのかを考えた場合に用いられるのがリプレイスメント・レベルです。この数字はレギュラーが怪我をしたときに代わりに出てくるであろう平均的な控え選手を0として想定しています。

…というのが一般的なリプレイスメント・レベルの解説となりますが、少々話が飛躍しており、馴染みのない概念を受け入れるのにはやや分かりづらい印象を受けます。

「平均」は本当に平均なのか

実際に高校や大学で野球をプレイしていた方ならご存知でしょうが、ドラフト指名されプロ入りできる選手というのは競技人口の中でもほんの一握りしか存在しません。私たちが普段目にするプロ野球の表舞台ではいまいちパッとしないような選手でも、その多くはアマチュアではエースで4番、名の知れたスター選手でした。才能の上澄み・逸材の集まりこそがプロ野球であり、その陰にはプロに入りたくても入れなかった選手が何千倍・何万倍もいるのです。

こうした球界におけるプロ野球選手の希少性を表すと図1のようになります。能力の高い選手になるほど、図でいうところの右に向かうほど、人数が少なくなります。そしてプロ野球を開催するには点線の枠線内ほどの選手数が必要です。さらに、この枠線の外側の青い部分はこのイラストには収まりきらず、どんどん左上に広がっていきます。ここに無数のアマチュア選手がいるわけです。プロ野球選手というのは球界の中でこのような立ち位置にある、希少な人材なのです。

table

そんな選ばれたエリート集団のプロスポーツ選手ですが、彼らの能力は一般に正規分布を描くと考えられています。MLBスカウトが20-80スケールを用いるのもこれが理由です[1]

table

図で表すと、上記のような感じです。この分布図は図1の点線の枠線内とイメージしてください。軸の数字は場合によって違うのですが、ここではとにかく選手の能力の分布がこういうものなのだというイメージさえつかんでもらえれば大丈夫です。対象内で最も平均的な選手は最も人数が多く、すなわち一般的に最も確保が容易である人材ということです。

さて、これを見てもらった上で、この選手達の出場機会の総数はいったいどのような分布になっているか想像がつくでしょうか。なお、能力に該当するものが何なのかにもよるのですが、今回は首脳陣が見込んだその選手の貢度度としておきましょう。

table

1シーズンで出場させられる機会数は限られています。わざわざ能力の劣る選手と優れた選手とを同じだけ出場させる必要はないわけで、出場機会はおのずとこの青い山のように、優れた選手側に偏ったものになります。おおざっぱなグラフですが、こちらも細かい形に意味はないので、ざっくりとしたイメージだけつかんでください。もちろんチームによって、能力の劣る選手を起用しなければならない場合もあれば、他球団ならスタメンクラスの選手を控えに回す場合もあります。あくまで全体の傾向の話です。

この図を見れば「平均成績」の問題点というのが見えてきたのではないでしょうか。普段目にする一軍成績とはこの図の青い部分で、その平均というと青い山の中央のあたり。これは選手全体(赤い山)で見た場合はかなり右に寄っており、とても平均的な選手の成績とは言えません。

具体例として、2019年の打者成績をOPSごとに分け、それぞれの打席数を合計した分布図を示します。

table

これは偶然山になっているわけではなく、毎年形は違えど平均のあたりを頂点にした分布を形成しています。そして、言うまでもないですがこの山は図3の青の山に相当します。

2019年のNPB平均であるOPS.716は、NPB全体で見た場合の平均的な選手の成績ではないということを理解していただけたかと思います。

図で見るリプレイスメント・レベル

リーグ平均成績は図で見て右側の優れた人材によるものであり、これを0として選手評価を行うと支障が出てきます。何せ、スタメンの選手が怪我などで離脱した場合、代わりに出場させられるのは赤い山で示した能力分布図中央のボリュームゾーンに位置する選手である可能性が高いわけです。

防御率1点台だが開幕して早々に離脱したガラスのエースと、リーグ平均の防御率3.90で1年ローテを守った投手。リーグ平均からの相対評価で見ると、前者はプラス、後者は0ですが、平均的な球団に所属していた場合、前者の離脱した期間に代わりに投げるのは平均成績より明確に劣る、赤い山の中央付近の選手だと想定できます。 よって、選手個人の評価を行う際には後者の「代わりの選手を出場させないことによって生んだ価値」を考慮してやる必要があります。

table

ここで登場するのがリプレイスメント・レベルです。リプレイスメント・レベルでは、この図のど真ん中の平均的のラインを0と考えます。リプレイスメント・レベルを基準に相対評価を行えば、選手は出場した分だけ「代わりの選手を出場させないことによって生んだ価値」による評価を得ることになります。

平均的な成績の選手の成績なんてわかるのか?と思われるかもしれませんが、それに近いであろう数字を推測することは可能です。

リプレイスメント・レベルの算出方法で一番シンプルなのが、出場頻度の高い順に80%を除外し、残りの選手の成績を求めるというもの。優秀な成績を残す選手ほどたくさん出場する傾向が強いので合理的です。

というわけで、この図の青い山の右上から80%削ってみましょう。

table

大体ですが80%削りました。残った青い部分を合算すると「リーグで平均的な選手」にそこそこ近い数字になりそうですよね。要するにリプレイスメント・レベルってこれのことなのです。この残った青い部分。

WARだと以下の通りになります。

table

リーグ平均選手はWAR2.0、代替可能選手はWAR0.0というのは、図にするとこういうことなのです(重ね重ねになりますが、これは厳密なグラフではなくイメージをつかみやすくするためのものです)。単に平均成績を0とするよりも大局的な評価と言えます。

「代替可能選手」などという未知の概念を考えようとすると混乱しますが、単に評価基準を一軍のリーグ平均から選手全体の平均に置き換えただけ。と捉えれば、より本質に近づいている感じがしませんか?

実際にその球団にWAR0の控え選手がいるかどうかは考慮する必要はありません。平均的な控え選手を用意できるかはチームや編成の事情であって、その選手個人の評価とは関係のない部分だからです。

もしも全球団の代替可能選手がこのラインを上回ったのであればそれはリプレイスメント・レベルが低すぎることを意味します。なぜなら「平均的な代替可能選手」は代替可能選手の中での平均なのですから、それを上回る選手・下回る選手がいるのは当たり前のことです。WARが0を割ったら出場させるべきかどうかみたいな議論も同じです。

ちなみに、リプレイスメント・レベルの求め方としては複数の方法がありますが、求められる数字は似通っています。この数字は、過去のチーム勝率のワースト記録がちょうどそのあたりだったり、日本で言えば分配ドラフトと自由契約・新外国人(・ドラフト)で戦力を用意するほかなかった初年度の楽天はリプレイスメント・レベルよりやや高い勝率.281を記録していたりと、過去の事例を見るに実態とそれほどずれた数字ではないと考えられます。

この説明が、「リプレイスメント・レベル」があまりピンと来ていない人の理解の一助になれば幸いです。


[1]20-80スケールを使ったスカウティング的観戦のすすめ
https://1point02.jp/op/gnav/column/bs/column.aspx?cid=53243

二階堂 智志(にかいどう・さとし)@PennantSpirits
自身のWebサイトで、野球シミュレーションゲームやセイバーメトリクスの分析結果を発表。成績予測システム開発のほか、打順シミュレーター作成などの実績がある。
http://pennantspirits.blogspot.com/
  • このエントリーをはてなブックマークに追加
  • Pocketに追加

  • アーカイブ

執筆者から探す

月別に探す

もっと見る