投手の査定をするときに非常に困るものはなんでしょうか?
そう!ピンチに強いかどうか!
左打者に強いかどうかとかは本当にデータを検証したりした結果がないとどうにもならんのですが、ピンチに強いかどうかは現状揃っているデータから割り出せそう!
ということでやってみました。
半分くらいは算出過程なのでかなりめんどくさいです。
え~っと、タイトルに「WHIP」とか書いてますが
WHIPは厳密には使用しません!!!
色々振り返って見ると粗が多いですが
気にしてはいけない!気にするな!
最終的に納得してもいいような数値が出てきたので、下に置いてあるツールにはそれを使用しています。
ある程度納得してもいい数値が出てきたのでそれを利用しています。
まあWikipediaとNPBに載ってるレベルのデータを駆使します。
また、今回このツールを作成するに当たってデータで楽しむプロ野球様のデータを引用させていただきました。
こちらですね。本当にありがとうございました。素晴らしい宝庫です。大切にしましょう。
何をもってピンチに強いとするか
まずここからですね。何をもってピンチに強いと定義するか。
ここは成績から割り出される「予測失点率」より実際の失点率が高ければピンチに弱い、逆ならピンチに強いとして定義します。
なお、防御率でなく失点率で考える理由は失策の影響を考えなくて済むと思ったからです。あとから考えれば失点率は嫌でも高く出るのでおかしい気もしますが、現状から算出しやすいのが失点率だったので失点率を採用しています。
防御率は失策が絡むとどれだけ打たれようが計上されないので、採用しません。
使用した&使用する指標
※データで楽しむプロ野球さまと表記がズレていると思います。気にしてはいけない。
打者
○四球数・死球数
○盗塁企図数・盗塁数・盗塁死数
投手
○対戦打者数
○被安打数・与四球数・与死球数
○投球回数
○失点
以上です。これ以外には使用しません。
また、これ以降はめんどくさい数字や数学の話になります。読み飛ばしてもらって構いませんが、データを扱って云々する人や僕にツッコミを入れたい人は読んでください。
1イニングあたりの出塁期待値の算出
まず本題に入る前に一つ書いておきますが、犠打や犠飛を全く考慮に入れていません。
が、ここでは(被安打数+与四死球)/対戦打者数 を 出塁率 と表記します。
「それは出塁率じゃない」という意見には耳を傾けません。よろしいな?
というのも、Wikipediaさんには投手の被犠打や被犠飛、併殺数などが記載されていないので無視せざるをえないのです。
あくまで無理矢理数字を出すのが目的なので細かいことを指摘するのは無粋ということを頭に入れてくださいな。
打者がX人で1イニングが終わる確率を考える
まず、1イニングがX人で終わる確率を考えます。このとき出塁者数はX-3人となります。
4人で終わるときは出塁者数は1人、6人で終わるときは出塁者数は3人です。
また、X人で終わるには2人がアウトの状態でX人目の打者がアウトになる場合です。
このときの計算は
となります。
X-1人目の時点で2アウトになっている状態でX人目がアウトになる確率となります。
これがX人で終わる確率です。
また、これにそれぞれX-3を乗算した和が1イニングごとの出塁期待値です。
ん?1イニングごとの出塁期待値……?
WHIPやん!!!
ってなりますが、今回扱っているのは投球回ではなく対戦打者数なので微妙な数値に違う数値になります。WHIPを使ってもいいんですが、上手いこといかなかったのでこっちの値を使ってます。
WHIPを使ってもいいのよ。その場合、数値がズレたりするから再検証が必要だけど。
出塁打率・出塁打率+を求める
ここで出塁打率とかいう言葉を出しました。これは僕が勝手に編み出した言葉です。
これは打者成績の指標です。
以下のように定義します。
簡単に言えば「出塁したときにどれだけ進むか」を計上したものになります。
次に出塁打率+を考えます。これの定義は以下の通りです。
出塁打率+=(塁打数+四死球数+盗塁数ー盗塁死数)/(安打数+四死球数+盗塁企図数)
出塁打率+は出塁打率に盗塁の要素を含めたものです。
勝手に定義した言葉なんですが、これを表す言葉を知らないので勝手に編み出しました。そういう言葉があれば教えてくださいお願いします。
また、今後は塁打数+四死球数を出塁打数と定義して話を進めていきます。
出塁打数・得点の期待値を求める。
上記で求めた1イニングあたりの出塁数の期待値に出塁打率を乗算します。
これが1イニングあたりの出塁打数の期待値となります。1イニングあたりなのでこれに9を乗算すると9イニングあたりの出塁打数の期待値となります。
次にみなさんご存知のように野球は4つのベースを回ることで1得点となるので9イニングあたりの出塁打数の期待値を4で除算すると
予測失点率が捻出できます!やったぜ!
ただし、これは盗塁のことを全く考えていないため低い値が出ます。
また、出塁打率+も犠打や犠飛、併殺などを考慮していないため高い値が出てしまいます。
ではどうするか。
相乗平均を取れば結構いい感じになります。
何故かは知りません。
多分釣り合いが取れてそうなるんじゃないですかね。結構適当なんですが結果的にそうなるんだからしょうがない。
/)
///)
/,.=゙''"/
/ i f ,.r='"-‐'つ____ こまけぇこたぁいいんだよ!!
/ / _,.-‐'~/⌒ ⌒\
/ ,i ,二ニ⊃( ●). (●)\
/ ノ il゙フ::::::⌒(__人__)⌒::::: \
,イ「ト、 ,!,!| |r┬-| |
/ iトヾヽ_/ィ"\ `ー'´ /
の精神でいきましょう。はい。
またこの出塁打率と出塁打率+の相乗平均を
出塁打率αと呼称します。
年度ごとの出塁打率αを無理矢理算出する。
ここでデータで楽しむプロ野球さまを引用します。
データで楽しむプロ野球さまには2011年から2017年までの上述した打者成績がチームごとに乗せられてます。
これを使って12球団×7年=84のデータを取得し、ここから出塁打率αを84取得します。
出塁打率αと本塁打数の相関係数*1は0.913821でした。
これはかなり相関が強い数値ですので採用していいと判断しました。
また、試合数は年度ごとに違うので本塁打数ではなく1試合あたりの本塁打数で考えます。
そうなるとx=1試合あたりの本塁打数、y=出塁打率α と考えると以下のような線形類似曲線を得られました。
y=0.2257x+1.132
これを年度ごとの出塁打率αとして考えます。
以上より、投手成績(対戦打者数・被安打・与四死球数)およびその年度の本塁打数と試合数がわかれば無理矢理ピンチに強いかどうかを割り出すことに成功しました。
誰が何と言おうと成功しました!違うのなら教えてください!
ツールの配布
あーだこーだ長ったらしく話しましたが、これがそれです。
アホみたいに時間かけた結晶です。マジで疲れた。
算出の過程というか思考の過程は上記に書いてあるので違ってる点があれば教えてください。
ちなみに
どれくらいからピンチに強いのかって話ですが
捻出した数字からあなたの感覚でやってください
としかいいようがない。というか完全に完成したのさっきのことなんであまり考えてない。
個人的には
±0.33~でC or E
±0.66~でB or F
±1.00~でA or G
あたりで考えてはいます。
というかこんなの今作ったような指標なのでどうにもできんと思いますよ。君の答えが全てです。
以上!解散!
とりあえず書いておく
以前、このことを書いたらC練さんより「LOB%使えばいいと思います」と教示いただいたのですが、
LOB%を見てもさっぱりわからん頭
なので諦めました。どれくらいからピンチに強いって言えばいいかわかんないので。まあ指標があるんでしょうが、こっちで推し進めたかった。
C練さんごめんなさい。
*1:二つのデータがどれだけ関連性があるかを表す数値。-1~+1の範囲で0から遠いほど関連性がある。詳しくはググってどうぞ