2008/09/26

Plate Discipline

→ Ayukawayen:這樣吧 OSw%是false positive, 1-ZSw%是false negative 09/26 22:21
→ Ayukawayen:這樣F-score就等於...推不下 有興趣的自己算吧 XD 09/26 22:21

因為有人這樣說了,所以......

InsideOutside
Swingtrue negativefalse negative
Not-Swingfalse positivetrue positive

把打者想像成一個偵測壞球的系統,我們可以得到上面這個表格。

然後根據定義:

  • Recall = tp/(tp+fn)
  • Precision = tp/(tp+fp)
  • F-score = 2 * Recall * Precision / (Recall + Precision)
  • tn = ZSwing% * Zone%
  • fn = OSwing% * (1-Zone%)
  • fp = (1-ZSwing%) * Zone%
  • tp = (1-OSwing%) * (1-Zone%)
代入後可以得到 Recall = ((1-OSwing%)*(1-Zone%)) / (1-Zone%) = 1-OSwing%
Precision = ((1-OSwing%)*(1-Zone%)) / (1-Swing%)
F-score = 2 * Recall * Precision / (Recall + Precision)

再到FanGraphs找到今年的打擊成績套進去,就可以得到這份圖表:

Top 5
Chipper Jones0.7876
Adam Dunn0.7793
Milton Bradley0.7763
Lance Berkman0.7746
Brian Giles0.7713

Bottom 5
Bengie Molina0.6416
Carlos Gomez0.6417
Adam Jones0.6439
A.J. Pierzynski0.6445
Freddy Sanchez0.6492

(Vlady和Soriano驚險逃過後五名,他們雖然揮了一堆壞球但是起碼好球也揮了不少。)

雖然是個簡單的實驗,不過排名跟猜想的差不多。 :)

6 則留言:

  1. Hi,

    很有趣的研究,不過請問為什麼是用「2」來乘上Recall and Precision?

    又,什麼是recall, 什麼是precision?

    最後,兩位打者的F-score要差別到多少才算是"significant"?

    回覆刪除
  2. 定義如下:
    http://en.wikipedia.org/wiki/Precision_and_recall

    http://redbug.twbbs.org/index.php/2008/06/17/386

    至於差多少算是顯著差異就不太清楚了, 因為事實上打者也不是認為好球就揮/壞球就不揮, 把他們視為壞球偵測器也是硬套而已(如果是拿來判斷裁判判好壞球的正確率倒是很合理), 所以就算有個統計上的臨界值, 拿來硬套可能意義也不太大 :)

    回覆刪除
  3. Ayukawayen版主您好:
    很棒的研究分析,但讓我意想不到
    Albert Pujols的F-score竟然比RyanHoward的F-score還低

    另外,冒味請問版主能否方便讓小弟轉載給其他人分享,或是連結。


    謝謝您。

    回覆刪除
  4. 歡迎轉載 請附連結就好 :p
    Howard的選球一直都不差 我想應該是Pujols的排名比想像低吧
    之前只看BB/PA和K/PA也覺得Pujols的選球怎樣都有聯盟前五 但是FanGraphs提供了O-swing和Z-swing資料後一看....其實也還好 XD

    回覆刪除
  5. Ayukawayen版主您好
    不好意思,不知為何一直無法登入
    只好附連結在此
    http://www.wang40.com.tw/forum/viewthread.php?tid=80117&page=1&extra=page%3D1&sid=74shzr#pid614773

    最後謝謝您的分享

    回覆刪除
  6. Ayukawayen版主您好
    不好意思,不知為何一直無法登入
    只好附連結在此
    http://www.wang40.com.tw/forum/viewthread.php?tid=80117&page=1&extra=page%3D1&sid=74shzr#pid614773

    最後謝謝您的分享

    回覆刪除

Powered By Blogger