2008/05/11

RBI Estimation (2)

-所謂的估計,就是不知道的東西都我說了算-

前一篇文章中,先對於打點的狀況做了一些簡單的分析,之後也確認了並不用考慮盜壘split stats的影響,請參閱該篇的回應。

這禮拜我再到MLB.com去找了各split狀態下的GO和AO次數,發現了一些事情:

  • mlb.com的GO/AO欄是(GO+GDP)/AO,換句話說,雙殺打在GO這一欄只會記錄一次,而在GO/AO時才當做兩個GO來算。
  • SH和SF都有算進GO和AO裡。
  • 000時,GO+AO恰好等於AB-H-SO+SH+SF-ROE,AL和NL都是如此,所以這應該不是單純的巧合;在其他狀況時,GO+AO略高於以上的算式。
  • 把GO的數據更新過(採用MLB.com的GO-SF),暫不處理ROE的問題,再把前一個表格中,確定的部份重貼一次:

    Split

    000

    100

    020

    003

    120

    103

    023

    123

    RBI28122727291919413381268022153582
    1B/RBI16201/00005812/00002465/1321895/08952086/????1022/1022607/????797/????
    2B/RBI5109/00001699/0691771/0771251/0251634/????298/????185/0370250/????
    3B/RBI532/0000148/014893/009326/002661/012229/005819/003830/0090
    HR/RBI2812/2812944/1888367/0734104/0208360/1080138/041498/0294134/0536
    BB/RBI7804/00002370/00002316/0000791/00001072/0000506/0000869/0000351/0351
    HBP/RBI879/0000319/0000163/000068/0000144/000075/000049/000058/0058
    SF/RBI0/00000/00000/0000317/03170/0000433/0433275/0275416/0416
    SH/RBI0/0000882/0000266/000019/0019317/000053/????3/00030/0000
    GO/RBI24695/00008621/00003995/00001271/02253619/00001470/????858/????1151/????
    RBI'2812272729191941120219279801451
    RBI"0000217975312352131

    前四個狀態是確定的狀態,後四個則否。 以120為例,不足的2179RBI中有634RBI是二壘打將二壘跑者打回來的,剩餘的1545分打點是一壘打將二壘跑者打回來以及二壘打將一壘跑者打回來的額外進壘得分,從前文我們已經知道此時額外進壘得分的機率將比單一跑者時更高,遺憾的是我們還是不知道這兩者的比例。

    我採用一個最簡單的假設,假設在120時一壘打送回二壘跑者的比率是020時的c倍,則此時二壘打送回一壘跑者的比率也同樣是100時的c倍,則這兩個比率應該是60.2%和45.7%。

    其他三個狀況也用同樣的方式去計算,103時的SH我假設有30%將三壘跑者送回來,由於發生的次數不多,這個造成的誤差應該不至於太大。

    重新將表格畫過,並列出各數據的總BRI和平均RBI:

    Split

    000

    100

    020

    003

    120

    103

    023

    123

    Total Avg
    RBI2812272729191941338126802215358222257
    1B/RBI16201/00005812/00002465/1321895/08952086/12551022/1022607/1034797/118129885/6808 0.228
    2B/RBI5109/00001699/0691771/0771251/0251634/0924298/0440185/0370250/06159197/4061 0.442
    3B/RBI532/0000148/014893/009326/002661/012229/005819/003830/0090938/0575 0.613
    HR/RBI2812/2812944/1888367/0734104/0208360/1080138/041498/0294134/05364957/7966 1.607
    BB/RBI7804/00002370/00002316/0000791/00001072/0000506/0000869/0000351/035116079/0351 0.022
    HBP/RBI879/0000319/0000163/000068/0000144/000075/000049/000058/00581755/0058 0.033
    SF/RBI0/00000/00000/0000317/03170/0000433/0433275/0275416/04161441/1441 1.000
    SH/RBI0/0000882/0000266/000019/0019317/000053/00163/00030/00001540/0038 0.025
    GO/RBI24695/00008621/00003995/00001271/02253619/00001470/0297858/02011151/023544140/0959 0.022

    也就是說,一支一壘打平均可以打回0.228分打點,二壘打則是0.442分,以此類推。

    當然這並不能拿來推估選手的實際打點數,中心棒次的打者由於打擊時壘上跑者比平均來得多,他們也比較容易拿到打點。

    而這也不是個評量打者的好數據。確實地,棒球比賽最重要的一個數據就是勝場數,能幫助球隊贏球才是球員最終極的目的。對打者而言,增加得分和提高勝率幾乎是等價的,這也是打點一直以來被視為最能代表打者貢獻的數字的原因。

    但是,這裡的勝場數和得分數指的是團隊數據而非個人數據,如果個人的打點數增加卻沒能提高球隊的總得分,那仍然是沒有貢獻可言的。

    舉個例子,如果兩名球員有著幾乎相同的數據,球員A僅比球員B多了1HR而少了10BB(代表A有著略高的SLG和較低的OBP),由上表可看出一支全壘打平均帶來1.6分打點,而10個BB也不見得能擠出1分打點(這還沒考慮到A剩下的9個打席中,SF和GO製造的打點)。然而B可以增加隊友打點的機會,還可以讓球隊多打十餘個打席,雖然B的打點數很可能會不及A,但不管從什麼方面來看,能讓帶來較多團隊得分的應該是B才對。

    所以這個數據就僅僅是推估打者在聯盟平均的壘上狀況時,可以拿到幾分打點而已,像是Expected winNeutralized wins計算投手在隊友和對手都是聯盟平均的狀態下可以拿到多少勝投,不過更沒有意義一點。

    也因此開宗明義的第一句也就說了:這是個沒什麼意義的數據


    下一篇打算來算一下2007年打者的Estimated RBI,以及與實際RBI的比較。


    相關文章

  • RBI Estimation (1)
  • RBI Estimation (3)
  • 沒有留言:

    張貼留言

    Powered By Blogger