體育數(shù)據(jù)分析方法--數(shù)學(xué)和統(tǒng)計(jì)學(xué)在棒球、足球、籃球等運(yùn)動(dòng)中的應(yīng)用(原書(shū)第二版)
定 價(jià):160 元
- 作者:盧文云,虞思逸,劉雨劍
- 出版時(shí)間:2026/1/1
- ISBN:9787030823885
- 出 版 社:科學(xué)出版社
- 中圖法分類:G80-32
- 頁(yè)碼:338
- 紙張:
- 版次:1
- 開(kāi)本:B5
本書(shū)以精煉而系統(tǒng)的方式,介紹在體育研究中切實(shí)有用的分析與統(tǒng)計(jì)方法。全書(shū)以體育數(shù)據(jù)的實(shí)際應(yīng)用與結(jié)果解讀為主線,突出體育數(shù)據(jù)分析有別于常規(guī)統(tǒng)計(jì)分析的特性。全書(shū)匯集了多種運(yùn)動(dòng)項(xiàng)目的大量典型案例,為各章提供必要的計(jì)算指導(dǎo)與進(jìn)階閱讀建議,幫助讀者進(jìn)一步將所述方法有效落地。
更多科學(xué)出版社服務(wù),請(qǐng)掃碼獲取。
主持國(guó)家社科基金項(xiàng)目3項(xiàng)、國(guó)家體育總局決策咨詢研究重大項(xiàng)目2項(xiàng)、國(guó)家社科基金重大招標(biāo)項(xiàng)目子課題2項(xiàng),參與國(guó)家社科基金項(xiàng)目12項(xiàng);作為執(zhí)筆人撰寫(xiě)3份專報(bào)獲副國(guó)級(jí)領(lǐng)導(dǎo)批示;在核心期刊發(fā)表論文40余篇,出版專著4部;獲省政府一等獎(jiǎng)2項(xiàng),三等獎(jiǎng)2項(xiàng);曾獲全國(guó)教育碩士?jī)?yōu)秀教育管理者榮譽(yù)。
目錄
1 引言 1
1.1 體育數(shù)據(jù)的分析方法 1
1.2 全書(shū)架構(gòu) 2
1.3 數(shù)據(jù) 3
1.4 計(jì)算 4
1.5 進(jìn)階閱讀建議 5
2 體育數(shù)據(jù)描述與匯總 7
2.1 引言 7
2.2 體育數(shù)據(jù)的種類 8
2.3 頻率分布 10
2.4 單指數(shù)結(jié)果匯總:平均值與中位數(shù) 18
2.5 體育數(shù)據(jù)中的變化檢測(cè) 21
2.6 定性變量中的變化檢測(cè):以投球種類為例 24
2.7 使用數(shù)學(xué)變換來(lái)提高球隊(duì)和球員表現(xiàn)的測(cè)量水平 26
2.8 每壘全壘打數(shù)與每全壘打壘數(shù) 30
2.9 計(jì)算 33
2.10 進(jìn)階閱讀建議 43
2.11 練習(xí) 44
3 概率 46
3.1 引言 46
3.2 在體育領(lǐng)域應(yīng)用概率規(guī)則 46
3.3 將體育事件結(jié)果作為隨機(jī)變量進(jìn)行建模 49
3.4 總結(jié)隨機(jī)變量的分布 52
3.5 得分分布與期望得分 53
3.6 概率分布與體育數(shù)據(jù)間的關(guān)系 55
3.7 在特定條件下的概率計(jì)算:條件概率 56
3.8 無(wú)條件概率與條件概率的紐帶:全概率法則 60
3.9 足球中率先進(jìn)球得分的重要性 61
3.10 獲勝概率 63
3.11 基于全概率法則對(duì)體育統(tǒng)計(jì)量進(jìn)行修正 64
3.12 NFL得分王對(duì)比 67
3.13 體育數(shù)據(jù)建模的兩大重要分布:二項(xiàng)分布與正態(tài)分布 68
3.14 使用Z分?jǐn)?shù)來(lái)比較NFL賽季的接球表現(xiàn) 72
3.15 使用概率論分析體育中的連勝紀(jì)錄 76
3.16 使用概率論評(píng)價(jià)統(tǒng)計(jì)中的“怪現(xiàn)象” 79
3.17 計(jì)算 82
3.18 進(jìn)階閱讀建議 84
3.19 練習(xí) 85
4 統(tǒng)計(jì)方法 88
4.1 引言 88
4.2 使用誤差范圍量化體育統(tǒng)計(jì)中的變化 88
4.3 計(jì)算均值和相關(guān)統(tǒng)計(jì)的誤差范圍 92
4.4 使用模擬分析檢測(cè)復(fù)雜統(tǒng)計(jì)中的變化 96
4.5 NFL傳球評(píng)分中的誤差范圍 99
4.6 球隊(duì)與球員間的比較 102
4.7 當(dāng)前結(jié)果是不是偶然的?理解統(tǒng)計(jì)顯著性 104
4.8 比較美國(guó)聯(lián)盟與國(guó)家聯(lián)盟 105
4.9 誤差范圍與修正統(tǒng)計(jì)量 108
4.10 將統(tǒng)計(jì)學(xué)方法應(yīng)用到體育數(shù)據(jù)時(shí)的重要注意事項(xiàng) 111
4.11 計(jì)算 112
4.12 進(jìn)階閱讀建議 118
4.13 練習(xí) 118
5 運(yùn)用相關(guān)性分析來(lái)發(fā)現(xiàn)數(shù)據(jù)中的統(tǒng)計(jì)關(guān)系 121
5.1 引言 121
5.2 線性關(guān)系:相關(guān)系數(shù) 121
5.3 “畢達(dá)哥拉斯公式”能被用于預(yù)測(cè)隊(duì)伍下半場(chǎng)的表現(xiàn)嗎? 127
5.4 運(yùn)用秩相關(guān)來(lái)描述一些特定的非線性關(guān)系 128
5.5 一名頂級(jí)跑衛(wèi)在NFL比賽中的重要性 129
5.6 識(shí)別和移除潛在變量的影響 130
5.7 MLB比賽中投手防御率與殘壘率的關(guān)系 131
5.8 運(yùn)用自相關(guān)來(lái)發(fā)現(xiàn)體育數(shù)據(jù)中的規(guī)律 132
5.9 量化NFL中薪資帽的影響 135
5.10 描述類別變量間的關(guān)聯(lián)性 136
5.11 分析傳球沖擊對(duì)Brady比賽表現(xiàn)的影響 142
5.12 納達(dá)爾為什么在紅土場(chǎng)地表現(xiàn)很好 143
5.13 使用球隊(duì)層面的數(shù)據(jù)所要注意的事項(xiàng) 144
5.14 傾向于面對(duì)更多投球的擊球員表現(xiàn)會(huì)更優(yōu)秀嗎? 146
5.15 計(jì)算 148
5.16 進(jìn)階閱讀建議 153
5.17 練習(xí) 154
6 運(yùn)用線性回歸進(jìn)行體育數(shù)據(jù)建模 157
6.1 引言 157
6.2 運(yùn)用簡(jiǎn)單線性回歸來(lái)對(duì)兩個(gè)變量間的關(guān)系進(jìn)行建模 157
6.3 回歸系數(shù)的不確定性:誤差范圍與統(tǒng)計(jì)顯著性 162
6.4 勝于替補(bǔ)與團(tuán)隊(duì)獲勝之間的關(guān)系 164
6.5 均值回歸:為什么表現(xiàn)極佳的隊(duì)伍可能會(huì)逐漸變差而墊底球隊(duì)
可能會(huì)逐漸提升 166
6.6 尋找逆轉(zhuǎn)局勢(shì)的擊打 170
6.7 NFL教練會(huì)落伍嗎?一次數(shù)據(jù)不全的案例 172
6.8 運(yùn)用多項(xiàng)式回歸來(lái)建模非線性關(guān)系 173
6.9 英超聯(lián)賽中傳球與進(jìn)球的關(guān)系 178
6.10 用log 變換對(duì)那些在運(yùn)動(dòng)分析中有乘積效應(yīng)的變量進(jìn)行建模 180
6.11 使用多年度數(shù)據(jù)進(jìn)行分析時(shí)的注意事項(xiàng) 186
6.12 計(jì)算 188
6.13 進(jìn)階閱讀建議 195
6.14 練習(xí) 195
7 多變量的回歸模型 199
7.1 引言 199
7.2 多元回歸分析 199
7.3 多元回歸分析中系數(shù)的意義 200
7.4 三振率與投球速度和投球軌跡的關(guān)系建模 203
7.5 英超聯(lián)賽中傳球與進(jìn)球關(guān)系的進(jìn)一步分析 205
7.6 多變量相關(guān)性與回歸 206
7.7 分析西甲選手的進(jìn)攻貢獻(xiàn) 207
7.8 利用交互作用對(duì)有協(xié)同效應(yīng)和拮抗效應(yīng)的變量進(jìn)行建模 210
7.9 沖刺時(shí)間與體重和力量的建模 212
7.10 分析三振率與投球速度和軌跡的模型中變量之間的交互關(guān)系 214
7.11 運(yùn)用如聯(lián)盟和位置等類別變量進(jìn)行預(yù)測(cè) 215
7.12 NBA中籃板與得分的關(guān)系 218
7.13 確定模型中最重要的變量:預(yù)測(cè)變量的相對(duì)重要性 221
7.14 影響PGA高爾夫選手得分的因子 225
7.15 選擇預(yù)測(cè)變量:找到最適合的NFL球隊(duì)得分模型 226
7.16 運(yùn)用回歸模型對(duì)預(yù)測(cè)進(jìn)行修正 231
7.17 修正后的平均失球率 233
7.18 使用Excel 計(jì)算 235
7.19 進(jìn)階閱讀建議 241
7.20 練習(xí) 242
8 一些進(jìn)階方法 245
8.1 引言 245
8.2 使用交叉驗(yàn)證和重采樣評(píng)價(jià)統(tǒng)計(jì)模型 246
8.3 二元響應(yīng)變量回歸模型 253
8.4 使用樹(shù)方法對(duì)復(fù)雜關(guān)系進(jìn)行建模 263
8.5 使用隨機(jī)森林對(duì)觀測(cè)進(jìn)行分類 269
8.6 分析變異性 272
8.7 使用池化方法提高隊(duì)伍及選手特定變量的估算能力 279
8.8 使用隨機(jī)效應(yīng)對(duì)回歸模型中的相關(guān)性進(jìn)行建模 285
8.9 使用樣條函數(shù)對(duì)非線性關(guān)系進(jìn)行建模 289
8.10 使用主成分分析對(duì)多變量數(shù)據(jù)進(jìn)行匯總 299
8.11 進(jìn)階閱讀建議 309
8.12 練習(xí) 310
參考文獻(xiàn) 314
可用數(shù)據(jù)集 318
圖表目錄
圖2.1 Braun 2011賽季安打數(shù)直方圖 14
圖2.2 Brady 2001—2011賽季傳球碼數(shù)直方圖 15
圖2.3 正態(tài)分布形狀 15
圖2.4 Charles 2010賽季進(jìn)攻嘗試碼數(shù) 16
圖2.5 2010—2011賽季NBA球員的命中率 16
圖2.6 2010—2011賽季不同位置NBA球員的命中率分布 17
圖2.7 2010—2011賽季不同位置NBA球員的命中率分布 18
圖2.8 2012年P(guān)GA高爾夫球員的獎(jiǎng)金分布 30
圖2.9 2011年MLB職業(yè)球員每棒全壘打數(shù)分布 32
圖2.10 2011年MLB職業(yè)球員每全壘打棒數(shù)分布 32
圖2.11 Seahawks隊(duì)2012年輸贏場(chǎng)次數(shù)據(jù)表 33
圖2.12 Brady數(shù)據(jù)表若干行 33
圖2.13 直方圖制作流程中的對(duì)話框 34
圖2.14 表格中的區(qū)間間斷值區(qū)域 34
圖2.15 Brady例子中的直方圖制作對(duì)話框 35
圖2.16 直方圖制作結(jié)果 35
圖2.17 Brady傳球數(shù)據(jù)的默認(rèn)直方圖 36
圖2.18 描述性統(tǒng)計(jì)對(duì)話框 36
圖2.19 描述性統(tǒng)計(jì)結(jié)果 37
圖3.1 一個(gè)示例性的直方圖 51
圖3.2 P(a圖3.3 正態(tài)分布的示例 70
圖4.1 Flacco逐場(chǎng)比賽的表現(xiàn)統(tǒng)計(jì) 112
圖4.2 Flacco的一次模擬賽季結(jié)果 113
圖4.3 Flacco的第二次模擬賽季結(jié)果 114
圖5.1 2011賽季MLB選手的得分?jǐn)?shù)與安打數(shù) 122
圖5.2 2011賽季MLB選手的保送數(shù)與安打數(shù) 122
圖5.3 2011—2012賽季NBA選手的場(chǎng)均進(jìn)攻籃板與場(chǎng)均防守籃板 123
圖5.4 2009賽季NFL四分衛(wèi)選手的達(dá)陣與被擒殺 123
圖5.5 MLB球隊(duì)2011賽季勝場(chǎng)數(shù)與2010賽季勝場(chǎng)數(shù) 124
圖5.6 2011賽季NFL球隊(duì)場(chǎng)均得分與場(chǎng)均失分 124
圖5.7 MLB球隊(duì)的每次上壘擊打中投球數(shù)與上壘率 147
圖5.8 MLB球員的每次上壘擊打中投球數(shù)與上壘率 147
圖5.9 MLB球員2011賽季的得分與安打數(shù)據(jù)示例 148
圖5.10 相關(guān)性對(duì)話框 149
圖5.11 相關(guān)性對(duì)話框的輸出 149
圖5.12 2011賽季MLB球員安打數(shù)據(jù)的示例 149
圖5.13 2011賽季MLB球員安打數(shù)據(jù)的相關(guān)性矩陣 150
圖5.14 2011賽季NFL球隊(duì)數(shù)據(jù)示例 150
圖5.15 2011賽季MLB球隊(duì)的秩數(shù)據(jù) 151
圖5.16 Chris Paul的一階滯后每場(chǎng)得分 151
圖6.1 2007—2011賽季MLB球隊(duì)得分與OPS的散點(diǎn)圖 158
圖6.2 球隊(duì)得分與OPS的回歸線 160
圖6.3 球隊(duì)得分與OPS的兩條回歸線 160
圖6.4 2007—2011賽季MLB球隊(duì)得分與全壘打的關(guān)系 161
圖6.5 Griffey每年的全壘打率 174
圖6.6 二次函數(shù)的一些例子 175
圖6.7 用二次回歸函數(shù)擬合Griffey的全壘打率 175
圖6.8 NHL前鋒場(chǎng)均得分與平均出場(chǎng)時(shí)間 176
圖6.9 NHL前鋒場(chǎng)均得分與平均出場(chǎng)時(shí)間的二次回歸 177
圖6.10 EPL場(chǎng)均進(jìn)球和傳球成功率的關(guān)系 178
圖6.11 EPL場(chǎng)均得分和傳球成功率關(guān)系的二次曲線圖 179
圖6.12 NHL比賽中l(wèi)og每場(chǎng)比賽得分與平均上場(chǎng)比賽時(shí)間的關(guān)系 181
圖6.13 NHL比賽中每場(chǎng)比賽得分與平均上場(chǎng)比賽時(shí)間的關(guān)系 181
圖6.14 40碼沖刺時(shí)間和體重的關(guān)系 183
圖6.15 2007—2011賽季MLB球隊(duì)的得分和OPS數(shù)據(jù)的前幾行 188
圖6.16 回歸的對(duì)話框 188
圖6.17 得分與OPS例子的回歸結(jié)果 189
圖6.18 Griffey數(shù)據(jù)的前幾列 189
圖6.19 Griffey數(shù)據(jù)的二次回歸結(jié)果 190
圖6.20 趨勢(shì)線(Trendline)按鈕 191
圖6.21 趨勢(shì)線(Trendline)對(duì)話框 191
圖7.1 MLB進(jìn)攻數(shù)據(jù)的前幾列 235
圖7.2 MLB例子中的回歸程序?qū)υ捒?236
圖7.3 2009賽季MLB投手?jǐn)?shù)據(jù)的前幾列示例 236
圖7.4 包含聯(lián)盟指示變量的2009 MLB投手?jǐn)?shù)據(jù) 237
圖8.1 NBA每場(chǎng)比賽的平均得分 250
圖8.2 使用不同的p得到的NBA得分?jǐn)?shù)據(jù)的回歸模型估計(jì) 251
圖8.3 不同擬合優(yōu)度在不同p下的值 252
圖8.4 射門(mén)命中率估計(jì)曲線 257
圖8.5 基于選秀和大學(xué)數(shù)據(jù)的外接手職業(yè)生涯預(yù)測(cè)分類樹(shù) 265
圖8.6 剪枝后的外接手職業(yè)生涯預(yù)測(cè)分類樹(shù) 266
圖8.7 NBA得分?jǐn)?shù)據(jù)的4節(jié)點(diǎn)線性樣條估計(jì) 291
圖8.8 NBA得分?jǐn)?shù)據(jù)的4節(jié)點(diǎn)三次樣條估計(jì) 291
圖8.9 NBA得分?jǐn)?shù)據(jù)的3節(jié)點(diǎn)三次樣條估計(jì) 292
圖8.10 使用不同節(jié)點(diǎn)數(shù)的三次樣條估計(jì)擬合NBA得分?jǐn)?shù)據(jù) 293
圖8.11 NBA得分?jǐn)?shù)據(jù)的32節(jié)點(diǎn)懲罰三次樣條估計(jì) 294
圖8.12 NBA得分?jǐn)?shù)據(jù)的16 節(jié)點(diǎn)懲罰三次樣條估計(jì) 295
圖8.13 場(chǎng)均得分和場(chǎng)均投籃次數(shù)的關(guān)系 296
圖8.14 式(8.15)中關(guān)于年份與得分的樣條估計(jì) 296
圖8.15 5 個(gè)假想點(diǎn)的近似 301
圖8.16 仿真點(diǎn)以及其對(duì)應(yīng)的最大方差方向與回歸直線 302
表2.1 洋基隊(duì)2011賽季勝負(fù)場(chǎng)記錄 10
表2.2 洋基隊(duì)2011賽季勝負(fù)場(chǎng)統(tǒng)計(jì) 10
表2.3 Braun 2011賽季安打數(shù)據(jù) 11
表2.4 Brady 2001—2011賽季傳球碼數(shù)頻數(shù)表Ⅰ 11
表2.5 Brady 2001—2011賽季傳球碼數(shù)頻數(shù)表Ⅱ 12
表2.6 Brady 2001—2011賽季傳球碼數(shù)頻數(shù)表Ⅲ 12
表2.7 Charles 2010 賽季進(jìn)攻嘗試碼數(shù)頻數(shù)表Ⅰ 13
表2.8 Charles 2010 賽季進(jìn)攻嘗試碼數(shù)頻數(shù)表Ⅱ 13
表2.9 2011MLB選手進(jìn)攻數(shù)據(jù)統(tǒng)計(jì) 19
表2.10 各聯(lián)盟隊(duì)伍得分和失分的標(biāo)準(zhǔn)差 22
表2.11 各聯(lián)盟隊(duì)伍得分和失分的標(biāo)準(zhǔn)差 23
表2.12 打擊數(shù)據(jù)的四分位數(shù)范圍及標(biāo)準(zhǔn)差 24
表2.13 2012賽季投球變化率最高與最低的五位MLB投手 26
表2.14 2012年P(guān)GA高爾夫球手獎(jiǎng)金收入 28
表2.15 2012年P(guān)GA高爾夫球員對(duì)數(shù)變換獎(jiǎng)金 29
表3.1 一個(gè)概率分布的例子 50
表3.2 一個(gè)分布函數(shù)的例子 50
表3.3 在2009年綜合BAA是0.244的投球手的調(diào)整BAA 66
表3.4 標(biāo)準(zhǔn)正態(tài)分布的概率 71
表3.5 不同時(shí)代的最佳接球碼數(shù) 72
表3.6 至少有一次接球的所有球員當(dāng)年度接球碼數(shù)均值與標(biāo)準(zhǔn)差 73
表3.7 相較于表3.5的調(diào)整后的接球碼數(shù) 75
表3.8 基于最佳球員的均值與標(biāo)準(zhǔn)差統(tǒng)計(jì)量 76
表3.9 基于Miguel Cabrera數(shù)據(jù)的連續(xù)安打分布 77
表3.10 連勝紀(jì)錄的概率分布 79
表4.1 Durant 2011—2012賽季表現(xiàn)數(shù)據(jù)統(tǒng)計(jì)結(jié)果 92
表4.2 p<0.4時(shí)不同樣本量的誤差范圍 94
表4.3 Durant 2011—2012賽季的每場(chǎng)得分 97
表4.4 Durant模擬賽季的每場(chǎng)得分 98
表4.5 不同模擬次數(shù)對(duì)應(yīng)的誤差范圍的分布 99
表4.6 2012賽季NFL最強(qiáng)四分衛(wèi)的傳球評(píng)分及其誤差范圍 101
表4.7 Durant與James 2011—2012賽季比賽得分統(tǒng)計(jì)均值 102
表5.1 NFL勝率的滯后年數(shù)與自相關(guān)系數(shù) 135
表5.2 NFL勝率的滯后年數(shù)與自相關(guān)系數(shù) 136
表5.3 2014賽季NFL半場(chǎng)比賽結(jié)果和全場(chǎng)比賽結(jié)果的關(guān)系 137
表5.4 表示兩種分類變量的一般性表格 138
表5.5 2012賽季MLB先發(fā)投手?jǐn)?shù)據(jù) 138
表5.6 2012賽季MLB先發(fā)投手的假想數(shù)據(jù) 139
表5.7 2012賽季MLB先發(fā)投手的實(shí)際數(shù)據(jù) 139
表5.8 2009—2012賽季Brady 觸地傳球與擒殺數(shù)之間的關(guān)系 142
表5.9 Nadal在紅土場(chǎng)地和非紅土場(chǎng)地上的表現(xiàn) 143
表5.10 Nadal在紅土場(chǎng)地和非紅土場(chǎng)地時(shí)在自己發(fā)球局的表現(xiàn) 143
表5.11 Nadal在紅土場(chǎng)地和非紅土場(chǎng)地時(shí)在對(duì)手發(fā)球局的表現(xiàn) 144
表6.1 均值回歸的一些例子 168
表6.2 均值回歸進(jìn)一步的一些例子 168
表6.3 2011賽季關(guān)鍵OPS排名前十和后十的MLB選手 171
表6.4 2011賽季OPS排名前十和后十的MLB選手 172
表7.1 西甲聯(lián)賽中進(jìn)攻貢獻(xiàn)排名前20 位球員 209
表7.2 高爾夫數(shù)據(jù)的分析 225
表7.3 使用14個(gè)預(yù)測(cè)特征的回歸分析結(jié)果 227
表7.4 模型Ⅱ回歸分析結(jié)果 228
表7.5 模型Ⅲ回歸分析結(jié)果 230
表7.6 模型Ⅳ回歸分析結(jié)果 231
表7.7 2011賽季調(diào)整后的防守率(Adj RA)榜 233
表7.8 2010—2011賽季守門(mén)員中調(diào)整平均失球數(shù)(Adj GAA)最優(yōu)榜 234
表8.1 不同概率的優(yōu)勢(shì)和對(duì)數(shù)優(yōu)勢(shì) 255