右、斜め45度

右斜め45度は、「Done is better than perfect!」の日本語訳のつもり。進んでいれば良しとする精神を大事にしたい。

データ分析好きにはたまらない!『セイバーメトリックス・リポート1』

データ分析好きには、たまらない本が出ました。

プロ野球を統計学と客観分析で考えるセイバーメトリクス・リポート1

プロ野球を統計学と客観分析で考えるセイバーメトリクス・リポート1

日本の野球のデータを様々な角度から分析しています。

データ分析好きからすると、「どのような事象を分析対象にしているのか」「その事象を分析するときの障害(妥協せざるを得ないこと)をどう考えているのか」が知りたいわけです。


年齢変化と成績の関係について

まず、リード文。

仮に選手が25歳であれば、成績はさらに上昇していくことが期待される。一方、35歳であれば、一般的に考えて、成績は下降していく確率の方が高い。従って、年齢を考慮せず成績だけで年棒の額を決定することは、若い選手の過小評価、ベテランの選手の過大評価につながる。そのような判断で複数年の契約を結ぼうものなら、若手に対しては働きとかけ離れた年棒となり不満を招いたり、ベテランに対しては必要以上の投資となってしまう。


これはとても重要な視点である。
会社でもそうだけど、現在の働きがポテンシャル一杯一杯なのかどうかをどう見極めるかってのが、リーダーの資質だと思うので。


で、その分析のプロセスがまた面白いです。


デルタメソッドと言われる手法を利用してます。
これは、同じ選手で、25歳の時の成績と、26歳の時の成績 がどれだけ変化したか を集計するというものです。個人のレベルに差があるわけで、同じ選手で比較するというのがポイントですよね。

また、打席数の信頼性をあげるため、たとえば25歳の時に200打席プレーして出塁率が.330で、26歳の時に10打席プレーして出塁率が.220の選手は、.100の変化したいうことになります。がこれを直ちに全体の影響とするのは危険なわけです。こういった選手は、「出場機会が低い方」のデータで重みづけする(つまりこの選手は10打席)ことで、全体に対しての影響は少なくなります。


また、生存者バイアスというのがあります。
たとえば26歳のシーズンは出だしが不運に見舞われて、非常に成績が悪かった場合、本来もっと出場機会を与えられれば一定の水準に回帰していたのに、首脳陣の判断(人為的)でそこで出場機会を絶たれたというケースです。このようなケースを救う手法もあるみたいなんですが、まぁ難しいですよね。


結論ですが、打者は27歳が得点創出力がもっとも高いみたいです。
細かく言うと、

  • 四死球率(選球眼)は若いうちから上昇し、年齢を重ねても衰えない
  • 三振率は若いうちは減少するが、30歳あたりからまた徐々に増えていく
  • 本塁打率は若いうちは急速に上昇するが、20代後半から上昇したのと同じくらい急速に衰える
  • 単打率は、あまり変化を見せない。二塁打率は本塁打率に似ているが緩やかな変化をする
  • 三塁打率は若い時期から一貫して下降し続けていく


一方で、投手はほとんどの能力が下降する一方みたいです。
基本的に投手というのはぽっと出て、短命に終わるというキャリアが一般的だからと言えるかもしれない。


これは結構衝撃的だったなぁ。