定 價:¥149.00
作 者: | Mark E. Fenner |
出版社: | 機械工業(yè)出版社 |
叢編項: | |
標(biāo) 簽: | 暫缺 |
ISBN: | 9787111701033 | 出版時間: | 2022-08-01 | 包裝: | |
開本: | 16開 | 頁數(shù): | 564 | 字?jǐn)?shù): |
第一部分 機器學(xué)習(xí)入門
第1章 機器學(xué)習(xí)概論 3
1.1 歡迎來到機器學(xué)習(xí)的世界 3
1.2 范圍、術(shù)語、預(yù)測和數(shù)據(jù) 4
1.2.1 特征 5
1.2.2 目標(biāo)值和預(yù)測值 6
1.3 讓機器開始機器學(xué)習(xí) 7
1.4 學(xué)習(xí)系統(tǒng)舉例 9
1.4.1 預(yù)測類別:分類器舉例 9
1.4.2 預(yù)測值:回歸器舉例 10
1.5 評估機器學(xué)習(xí)系統(tǒng) 11
1.5.1 準(zhǔn)確率 11
1.5.2 資源消耗 12
1.6 創(chuàng)建機器學(xué)習(xí)系統(tǒng)的過程 13
1.7 機器學(xué)習(xí)的假設(shè)和現(xiàn)實 15
1.8 參考閱讀資料 17
1.8.1 進一步研究方向 17
1.8.2 注釋 17
第2章 相關(guān)技術(shù)背景 19
2.1 編程環(huán)境配置 19
2.2 數(shù)學(xué)語言的必要性 19
2.3 用于解決機器學(xué)習(xí)問題的軟件 20
2.4 概率 21
2.4.1 基本事件 22
2.4.2 獨立性 23
2.4.3 條件概率 24
2.4.4 概率分布 25
2.5 線性組合、加權(quán)和以及點積 28
2.5.1 加權(quán)平均 30
2.5.2 平方和 32
2.5.3 誤差平方和 33
2.6 幾何視圖:空間中的點 34
2.6.1 直線 34
2.6.2 直線拓展 39
2.7 表示法和加1技巧 43
2.8 漸入佳境:突破線性和非線性 45
2.9 NumPy與“數(shù)學(xué)無所不在” 47
2.9.1 一維數(shù)組與二維數(shù)組 49
2.10 浮點數(shù)問題 52
2.11 參考閱讀資料 53
2.11.1 小結(jié) 53
2.11.2 注釋 54
第3章 預(yù)測類別:分類入門 55
3.1 分類任務(wù) 55
3.2 一個簡單的分類數(shù)據(jù)集 56
3.3 訓(xùn)練和測試:請勿“應(yīng)試教育” 59
3.4 評估:考試評分 62
3.5 簡單分類器1:最近鄰分類器、遠距離關(guān)系和假設(shè) 63
3.5.1 定義相似性 63
3.5.2 k-最近鄰中的k 64
3.5.3 答案組合 64
3.5.4 k-最近鄰、參數(shù)和非參數(shù)方法 65
3.5.5 建立一個k-最近鄰分類模型 66
3.6 簡單分類器2:樸素貝葉斯分類器、概率和違背承諾 68
3.7 分類器的簡單評估 70
3.7.1 機器學(xué)習(xí)的性能 70
3.7.2 分類器的資源消耗 71
3.7.3 獨立資源評估 77
3.8 參考閱讀資料 81
3.8.1 再次警告:局限性和尚未解決的問題 81
3.8.2 小結(jié) 82
3.8.3 注釋 82
3.8.4 練習(xí)題 83
第4章 預(yù)測數(shù)值:回歸入門 85
4.1 一個簡單的回歸數(shù)據(jù)集 85
4.2 最近鄰回歸和匯總統(tǒng)計 87
4.2.1 中心測量:中位數(shù)和均值 88
4.2.2 構(gòu)建一個k-最近鄰回歸模型 90
4.3 線性回歸和誤差 91
4.3.1 地面總是不平坦的:為什么需要斜坡 92
4.3.2 傾斜直線 94
4.3.3 執(zhí)行線性回歸 97
4.4 優(yōu)化:選擇最佳答案 98
4.4.1 隨機猜測 98
4.4.2 隨機步進 99
4.4.3 智能步進 99
4.4.4 計算的捷徑 100
4.4.5 線性回歸的應(yīng)用 101
4.5 回歸器的簡單評估和比較 101
4.5.1 均方根誤差 101
4.5.2 機器學(xué)習(xí)的性能 102
4.5.3 回歸過程中的資源消耗 102
4.6 參考閱讀資料 104
4.6.1 局限性和尚未解決的問題 104
4.6.2 小結(jié) 105
4.6.3 注釋 105
4.6.4 練習(xí)題 105
第二部分 通用評估技術(shù)
第5章 機器學(xué)習(xí)算法的評估和比較分析 109
5.1 評估和大道至簡的原則 109
5.2 機器學(xué)習(xí)階段的術(shù)語 110
5.2.1 有關(guān)機器的重新討論 110
5.2.2 更規(guī)范的闡述 113
5.3 過擬合和欠擬合 116
5.3.1 合成數(shù)據(jù)和線性回歸 117
5.3.2 手動操控模型的復(fù)雜度 118
5.3.3 “恰到好處”原則:可視化過擬合、欠擬合和最佳擬合 120
5.3.4 簡單性 124
5.3.5 關(guān)于過擬合必須牢記的注意事項 124
5.4 從誤差到成本 125
5.4.1 損失 125
5.4.2 成本 126
5.4.3 評分 127
5.5?。ㄖ匦拢┏闃樱阂陨賱俣?128
5.5.1 交叉驗證 128
5.5.2 分層抽樣 132
5.5.3 重復(fù)的訓(xùn)練–測試數(shù)據(jù)集拆分 133
5.5.4 一種更好的方法和混排 137
5.5.5 留一交叉驗證 140
5.6 分解:將誤差分解為偏差和方差 142
5.6.1 數(shù)據(jù)的方差 143
5.6.2 模型的方差 144
5.6.3 模型的偏差 144
5.6.4 結(jié)合所有的因素 145
5.6.5 偏差–方差權(quán)衡示例 145
5.7 圖形可視化評估和比較 149
5.7.1 學(xué)習(xí)曲線:到底需要多少數(shù)據(jù) 150
5.7.2 復(fù)雜度曲線 152
5.8 使用交叉驗證比較機器學(xué)習(xí)模型 154
5.9 參考閱讀資料 155
5.9.1 小結(jié) 155
5.9.2 注釋 155
5.9.3 練習(xí)題 157
第6章 評估分類器 159
6.1 基線分類器 159
6.2 準(zhǔn)確度以外:分類器的其他度量指標(biāo) 161
6.2.1 從混淆矩陣中消除混淆 163
6.2.2 錯誤的方式 164
6.2.3 基于混淆矩陣的度量指標(biāo) 165
6.2.4 混淆矩陣編碼 166
6.2.5 處理多元類別:多元類別平均 168
6.2.6 F1分?jǐn)?shù) 170
6.3 ROC曲線 170
6.3.1 ROC模式 173
6.3.2 二元分類ROC 174
6.3.3 AUC:(ROC)曲線下的面積 177
6.3.4 多元分類機器學(xué)習(xí)模型、一對其他和ROC 179
6.4 多元