2011/01/09

2010 Lineup Evaluation - Review

下表是用2010年各隊各棒次的實際成績,代入Lineup Evaluator所算出的結果,但各棒次的GO/AO一律使用全隊平均代替。

Team實際得分/27預估得分/27
NYY 5.40385.1553
BOS 5.09135.1894
TBR 5.01714.5435
CIN 4.93644.8362
TEX 4.89504.7265
MIN 4.88134.8058
PHI 4.81944.5640
COL 4.81254.7117
TOR 4.74074.7072
CHW 4.70004.5296
DET 4.68074.6575
MIL 4.67244.6460
ATL 4.64264.5172
STL 4.57774.3870
FLA 4.49274.2112
ARI 4.44494.4203
SFG 4.32224.2384
CHC 4.27534.1280
LAA 4.21823.9359
KCR 4.18624.4006
OAK 4.16794.1230
LAD 4.15823.9072
SDP 4.12003.8458
WSN 4.08244.0267
NYM 4.05873.9498
CLE 4.02543.9805
HOU 3.80643.5301
BAL 3.79873.9493
PIT 3.67813.6529
SEA 3.17683.2978

平均來說,預估得分比實際得分低了約2.4%。誤差最多的Rays實際每27出局的得分是5.0171分,但預估得分只有4.5435分,低估了近10%;而高估最多的是Royals,高估了5.12%(4.1862/4.4006)。

Team實際得分/27預估得分/27誤差值誤差比率
KCR 4.18624.40060.21445.12%
BAL 3.79873.94930.15063.96%
SEA 3.17683.29780.12103.81%
BOS 5.09135.18940.09811.93%
DET 4.68074.6575-0.0232-0.50%
ARI 4.44494.4203-0.0246-0.55%
MIL 4.67244.6460-0.0264-0.56%
PIT 3.67813.6529-0.0252-0.69%
TOR 4.74074.7072-0.0335-0.71%
OAK 4.16794.1230-0.0449-1.08%
CLE 4.02543.9805-0.0449-1.12%
WSN 4.08244.0267-0.0557-1.36%
MIN 4.88134.8058-0.0755-1.55%
SFG 4.32224.2384-0.0838-1.94%
CIN 4.93644.8362-0.1002-2.03%
COL 4.81254.7117-0.1008-2.09%
NYM 4.05873.9498-0.1089-2.68%
ATL 4.64264.5172-0.1254-2.70%
TEX 4.89504.7265-0.1685-3.44%
CHC 4.27534.1280-0.1473-3.45%
CHW 4.70004.5296-0.1704-3.63%
STL 4.57774.3870-0.1907-4.17%
NYY 5.40385.1553-0.2485-4.60%
PHI 4.81944.5640-0.2554-5.30%
LAD 4.15823.9072-0.2510-6.04%
FLA 4.49274.2112-0.2815-6.27%
SDP 4.12003.8458-0.2742-6.66%
LAA 4.21823.9359-0.2823-6.69%
HOU 3.80643.5301-0.2763-7.26%
TBR 5.01714.5435-0.4736-9.44%

造成得分普遍低估的可能原因有很多,最直接的就是壘上有人時打者會打得比較好,這點是有數據支持的,原因可能是防守方在壘上有跑者時投球和守備上都比較困難‧但程式裡沒有區分,不管壘上有幾個跑者都一律以平均成績來推算事件的機率,就造成了得分的低估。

而Rays的得分超過預估最多倒是很好解釋,得分預估程式中GDP的發生機率是聯盟平均,再乘上可能發生的機會(壘上有人,未滿兩出局,打者擊出滾地出局),並不考慮打者與跑者的能力‧而Rays在2010年的GDP是全聯盟最低,僅有92次。再加上觸身保送率及跑者額外進壘率上,Rays去年也都名列前茅,所以實際得分超過計算結果甚多就不令人意外了。

反倒是誤差比率第二名的Astros比較難解釋,Astros的GDP%, HBP%和XBT%都不算出色,只有ROE%在前段班,只能說他們2010年對得分機會的把握比其他隊好吧。因為其他得分預測公式如XR及RC也都十分低估他們的得分。

講到這裡,最後來看看各種得分預測公式在2010年的準確度。

平均相關係數RMSE最大高估率最大低估率
LE/274.3191 (-0.1092)0.95180.18305.12%-9.44%
RC/274.6713 (+0.2429)0.95760.279811.11%-2.12%
LWTS'/274.4851 (+0.0568)0.95890.14808.68%-6.17%
XR/274.5194 (+0.0911)0.96420.15499.96%-3.62%
XRB/274.5097 (+0.0813)0.95880.15769.69%-5.49%

基本上還是完整版的XR最準確;RC/27因為普遍高估太多所以在絕對數據上吃了大虧,以相對分數來說它和LWTS及XRB其實可說是沒有差距的;Lineup Evaluator的準確度和這幾個老前輩相比,還是有段極小的差距,但也算是相當準了。畢竟Lineup Evaluator最主要的目標是在判別同樣的數據下,不同的棒次排列造成的影響,而不是以球隊總成績來估計球隊得分。

繼續閱讀
Powered By Blogger