→ Ayukawayen:這樣吧 OSw%是false positive, 1-ZSw%是false negative 09/26 22:21
→ Ayukawayen:這樣F-score就等於...推不下 有興趣的自己算吧 XD 09/26 22:21
因為有人這樣說了,所以......
Inside | Outside | |
Swing | true negative | false negative |
Not-Swing | false positive | true positive |
把打者想像成一個偵測壞球的系統,我們可以得到上面這個表格。
然後根據定義:
- Recall = tp/(tp+fn)
- Precision = tp/(tp+fp)
- F-score = 2 * Recall * Precision / (Recall + Precision)
- tn = ZSwing% * Zone%
- fn = OSwing% * (1-Zone%)
- fp = (1-ZSwing%) * Zone%
- tp = (1-OSwing%) * (1-Zone%)
Precision = ((1-OSwing%)*(1-Zone%)) / (1-Swing%)
F-score = 2 * Recall * Precision / (Recall + Precision)
再到FanGraphs找到今年的打擊成績套進去,就可以得到這份圖表:
Chipper Jones | 0.7876 |
Adam Dunn | 0.7793 |
Milton Bradley | 0.7763 |
Lance Berkman | 0.7746 |
Brian Giles | 0.7713 |
Bengie Molina | 0.6416 |
Carlos Gomez | 0.6417 |
Adam Jones | 0.6439 |
A.J. Pierzynski | 0.6445 |
Freddy Sanchez | 0.6492 |
(Vlady和Soriano驚險逃過後五名,他們雖然揮了一堆壞球但是起碼好球也揮了不少。)
雖然是個簡單的實驗,不過排名跟猜想的差不多。 :)
Hi,
回覆刪除很有趣的研究,不過請問為什麼是用「2」來乘上Recall and Precision?
又,什麼是recall, 什麼是precision?
最後,兩位打者的F-score要差別到多少才算是"significant"?
定義如下:
回覆刪除http://en.wikipedia.org/wiki/Precision_and_recall
http://redbug.twbbs.org/index.php/2008/06/17/386
至於差多少算是顯著差異就不太清楚了, 因為事實上打者也不是認為好球就揮/壞球就不揮, 把他們視為壞球偵測器也是硬套而已(如果是拿來判斷裁判判好壞球的正確率倒是很合理), 所以就算有個統計上的臨界值, 拿來硬套可能意義也不太大 :)
Ayukawayen版主您好:
回覆刪除很棒的研究分析,但讓我意想不到
Albert Pujols的F-score竟然比RyanHoward的F-score還低
另外,冒味請問版主能否方便讓小弟轉載給其他人分享,或是連結。
謝謝您。
歡迎轉載 請附連結就好 :p
回覆刪除Howard的選球一直都不差 我想應該是Pujols的排名比想像低吧
之前只看BB/PA和K/PA也覺得Pujols的選球怎樣都有聯盟前五 但是FanGraphs提供了O-swing和Z-swing資料後一看....其實也還好 XD
Ayukawayen版主您好
回覆刪除不好意思,不知為何一直無法登入
只好附連結在此
http://www.wang40.com.tw/forum/viewthread.php?tid=80117&page=1&extra=page%3D1&sid=74shzr#pid614773
最後謝謝您的分享
Ayukawayen版主您好
回覆刪除不好意思,不知為何一直無法登入
只好附連結在此
http://www.wang40.com.tw/forum/viewthread.php?tid=80117&page=1&extra=page%3D1&sid=74shzr#pid614773
最後謝謝您的分享