注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術工業(yè)技術建筑科學建筑設計Python數據挖掘與機器學習實戰(zhàn)

Python數據挖掘與機器學習實戰(zhàn)

Python數據挖掘與機器學習實戰(zhàn)

定 價:¥79.00

作 者: 方巍
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787111626817 出版時間: 2019-05-01 包裝: 平裝
開本: 16開 頁數: 280 字數:  

內容簡介

  本書作為數據挖掘和機器學習的讀物,基于真實數據集進行案例實戰(zhàn),使用Python數據科學庫,從數據預處理開始一步步介紹數據建模和數據挖掘的過程。書中主要介紹了數據挖掘的基礎知識、基本工具和實踐方法,通過循序漸進地講解算法,帶領讀者輕松踏上數據挖掘之旅。本書采用理論與實踐相結合的方式,呈現了如何使用邏輯回歸進行環(huán)境數據檢測,如何使用HMM進行中文分詞,如何利用卷積神經網絡識別雷達剖面圖,如何使用循環(huán)神經網絡構建聊天機器人,如何使用樸素貝葉斯算法進行破產預測,如何使用DCGAN網絡進行人臉生成等。本書也涉及神經網絡、在線學習、強化學習、深度學習和大數據處理等內容。 本書以人工智能主流編程語言Python 3版作為數據分析與挖掘實戰(zhàn)的應用工具,從Pyhton的基礎語法開始,陸續(xù)介紹了NumPy數值計算、Pandas數據處理、Matplotlib數據可視化、爬蟲和Sklearn數據挖掘等內容。全書共涵蓋16個常用的數據挖掘算法和機器學習實戰(zhàn)項目。通過學習本書內容,讀者可以掌握數據分析與挖掘的理論知識及實戰(zhàn)技能。 本書內容豐富,講解由淺入深,特別適合對數據挖掘和機器學習算法感興趣的讀者閱讀,也適合需要系統(tǒng)掌握深度學習的開發(fā)人員閱讀,還適合Python程序員及人工智能領域的開發(fā)人員閱讀。編程愛好者、高校師生及培訓機構的學員也可以將本書作為興趣讀物或教材使用。

作者簡介

  方巍博士,博士后,副教授,高級工程師,碩士生導師。美國佛羅里達大學訪問學者,中國計算機學會高級會員,ACM會員,中國系統(tǒng)分析師協(xié)會(CSAI)顧問團專業(yè)顧問,江蘇省計算機學會會員,江蘇省人工智能學會委員,江蘇省政府采購招標評審專家,江蘇省高新技術企業(yè)認定評審專家。負責和參與國家、省部級科研項目12項。在國內外學術期刊上發(fā)表論文20余篇,其中被SCI和EI檢索15篇。獲國家發(fā)明專利授權8項、軟件著作權9項。出版科技圖書2部。

圖書目錄

前言
第1章 機器學習基礎1
1.1 機器學習概述2
1.2 機器學習的發(fā)展歷程2
1.3 機器學習分類3
1.3.1 監(jiān)督學習3
1.3.2 無監(jiān)督學習3
1.3.3 強化學習4
1.3.4 深度學習4
1.4 機器學習的應用4
1.5 開發(fā)機器學習的步驟7
1.6 Python語言的優(yōu)勢8
1.6.1 可執(zhí)行偽代碼8
1.6.2 Python語言使用廣泛8
1.6.3 Python語言特色8
1.6.4 Python語言的缺點9
1.7 Python開發(fā)工具介紹9
1.7.1 IDLE簡介10
1.7.2 IPython簡介11
1.7.3 PyCharm簡介11
1.7.4 Jupyter Notebook簡介12
1.7.5 Anaconda和Spyder簡介13
1.8 本章小結15
第2章 Python語言簡介16
2.1 搭建Python開發(fā)環(huán)境16
2.1.1 安裝Anaconda16
2.1.2 安裝Spyder18
2.1.3 運行和保存Python程序19
2.2 Python計算與變量19
2.2.1 用Python做簡單的計算20
2.2.2 Python的運算符20
2.2.3 Python的變量21
2.3 Python的字符串22
2.4 Python的列表23
2.5 Python的元組25
2.6 Python的字典27
2.7 網絡爬蟲的發(fā)展歷史和分類28
2.7.1 網絡爬蟲的發(fā)展歷史28
2.7.2 網絡爬蟲的分類30
2.8 網絡爬蟲的原理30
2.8.1 理論概述30
2.8.2 爬蟲的工作流程31
2.9 爬蟲框架介紹36
2.9.1 Scrapy介紹36
2.9.2 XPath介紹39
2.10 網絡爬蟲的設計與實現40
2.10.1 網絡爬蟲的總體設計40
2.10.2 具體實現過程40
2.10.3 爬蟲結果與分析45
2.11 本章小結49
第3章 回歸分析50
3.1 回歸分析概述50
3.1.1 基本概念50
3.1.2 可以解決的問題51
3.1.3 回歸分析的步驟51
3.2 線性回歸51
3.2.1 簡單線性回歸分析51
3.2.2 多元線性回歸分析52
3.2.3 非線性回歸數據分析52
3.3 用Python實現一元線性回歸53
3.4 用Python實現多元線性回歸56
3.4.1 使用pandas讀取數據56
3.4.2 分析數據57
3.4.3 線性回歸模型58
3.5 基于線性回歸的股票預測62
3.5.1 數據獲取62
3.5.2 數據預處理63
3.5.3 編碼實現64
3.5.4 結果分析65
3.6 邏輯回歸66
3.6.1 構造預測函數67
3.6.2 構造損失函數J68
3.6.3 梯度下降法求解最小值69
3.7 基于邏輯回歸的環(huán)境數據檢測71
3.7.1 數據來源71
3.7.2 數據處理72
3.7.3 異常數據分析72
3.7.4 數據預測74
3.8 本章小結76
第4章 決策樹與隨機森林77
4.1 決策樹77
4.1.1 決策樹的基本原理77
4.1.2 決策樹的分類78
4.1.3 決策樹的優(yōu)缺點81
4.2 使用決策樹對鳶尾花分類82
4.2.1 Iris數據集簡介82
4.2.2 讀取數據83
4.2.3 鳶尾花類別83
4.2.4 數據可視化84
4.2.5 訓練和分類85
4.2.6 數據集多類分類86
4.2.7 實驗結果86
4.3 隨機森林87
4.3.1 隨機森林的基本原理87
4.3.2 隨機森林的收斂性88
4.3.3 隨機森林的OOB估計89
4.3.4 隨機森林的隨機特征選取89
4.3.5 隨機森林的優(yōu)缺點90
4.4 葡萄酒數據集的隨機森林分類91
4.4.1 數據收集91
4.4.2 相關庫函數簡介92
4.4.3 數據基本分析93
4.4.4 使用隨機森林構建模型97
4.4.5 實驗結果98
4.5 本章小結99
第5章 支持向量機100
5.1 SVM的工作原理及分類100
5.1.1 支持向量機的原理100
5.1.2 線性可分的支持向量機101
5.1.3 非線性可分的支持向量機102
5.2 核函數103
5.2.1 核函數簡介103
5.2.2 幾種常見的核函數104
5.2.3 核函數如何處理非線性數據104
5.2.4 如何選擇合適的核函數105
5.3 SVR簡介106
5.3.1 SVR原理106
5.3.2 SVR模型106
5.4 時間序列曲線預測107
5.4.1 生成訓練數據集107
5.4.2 運用不同的核函數進行支持向量回歸108
5.4.3 生成測試數據集109
5.4.4 預測并生成圖表110
5.4.5 獲取預測誤差111
5.4.6 創(chuàng)建數據集112
5.4.7 選取最優(yōu)參數112
5.4.8 預測并生成圖表112
5.4.9 獲取預測誤差113
5.5 本章小結114
第6章 隱馬爾可夫模型115
6.1 隱馬爾可夫模型簡介115
6.1.1 隱馬爾可夫模型的概念115
6.1.2 詳例描述116
6.1.3 HMM流程117
6.2 Viterbi算法117
6.3 HMM模型用于中文分詞119
6.3.1 UI界面119
6.3.2 數據及其編碼119
6.3.3 HMM模型121
6.3.4 實驗結果122
6.4 本章小結124
第7章 BP神經網絡模型125
7.1 背景介紹125
7.2 結構特點126
7.3 網絡模型126
7.4 人工神經網絡簡介127
7.4.1 神經元127
7.4.2 單層神經網絡128
7.4.3 雙層神經網絡129
7.4.4 多層神經網絡130
7.5 BP神經網絡131
7.6 通過TensorFlow實現BP神經網絡132
7.7 本章小結134
第8章 卷積神經網絡135
8.1 傳統(tǒng)圖像識別技術135
8.1.1 圖像預處理135
8.1.2 圖像特征提取136
8.1.3 圖像分類方法136
8.2 卷積神經網絡結構簡介137
8.2.1 卷積神經網絡發(fā)展歷程137
8.2.2 卷積神經網絡結構簡介137
8.3 卷積神經網絡的結構及原理139
8.3.1 卷積層139
8.3.2 池化層140
8.3.3 激活函數142
8.3.4 全連接層144
8.3.5 反饋運算144
8.4 卷積神經網絡的優(yōu)點146
8.5 雷達剖面圖識別模型148
8.5.1 數據準備148
8.5.2 構建模型150
8.6 模型測試分析157
8.6.1 部署基本模塊157
8.6.2 創(chuàng)建項目結構157
8.6.3 訓練網絡158
8.6.4 自動化測試158
8.7 本章小結160
第9章 循環(huán)神經網絡161
9.1 自然語言處理161
9.1.1 自然語言處理概述161
9.1.2 自然語言處理應用162
9.2 對話系統(tǒng)163
9.2.1 對話系統(tǒng)分類163
9.2.2 聊天機器人分類164
9.3 基于LSTM結構的循環(huán)神經網絡165
9.3.1 循環(huán)神經網絡165
9.3.2 通過時間反向傳播166
9.3.3 長短期記憶網絡(LSTM)169
9.4 Seq2Seq模型172
9.4.1 Encoder-Decoder框架173
9.4.2 Attention機制174
9.5 聊天機器人的程序實現176
9.5.1 準備數據176
9.5.2 創(chuàng)建模型178
9.5.3 訓練模型179
9.5.4 測試模型180
9.6 本章小結181
第10章 聚類與集成算法182
10.1 聚類方法簡介182
10.1.1 聚類定義183
10.1.2 聚類要求183
10.2 聚類算法184
10.2.1 劃分方法184
10.2.2 層次方法184
10.2.3 基于密度的方法184
10.2.4 基于網格的方法185
10.2.5 基于模型的方法185
10.3 K-Means算法185
10.3.1 K-Means算法概述185
10.3.2 K-Means算法流程185
10.3.3 K-Means算法實現186
10.3.4 實驗結果及分析188
10.3.5 K-Means算法存在的問題188
10.4 K-Means++算法189
10.4.1 K-Means++的基本思想189
10.4.2 K-Means++的數學描述190
10.4.3 K-Means++算法流程190
10.5 K-Means++的實現191
10.5.1 數據集191
10.5.2 代碼實現192
10.5.3 K-Means++實驗結果193
10.6 Adaboost集成算法的原理194
10.6.1 Boosting算法的基本原理194
10.6.2 Adaboost算法介紹195
10.6.3 Adaboost分類問題的損失函數優(yōu)化197
10.6.4 Adaboost二元分類問題的算法流程198
10.6.5 Adaboost回歸問題的算法流程199
10.6.6 Adaboost算法的正則化200
10.6.7 Adaboost的優(yōu)缺點200
10.7 Adaboost算法實現201
10.7.1 數據集處理201
10.7.2 實現過程201
10.7.3 實驗結果分析206
10.8 本章小結208
第11章 其他機器學習算法209
11.1 貝葉斯分類器210
11.1.1 概率基礎知識210
11.1.2 貝葉斯決策準則211
11.1.3 極大似然估計212
11.2 貝葉斯分類模型213
11.2.1 樸素貝葉斯分類模型213
11.2.2 半樸素貝葉斯分類模型216
11.2.3 貝葉斯網絡分類模型217
11.3 樸素貝葉斯分類器在破產預測中的應用219
11.3.1 數據集219
11.3.2 訓練多項式樸素貝葉斯模型220
11.4 在線學習222
11.4.1 線性模型的在線學習222
11.4.2 非線性模型的在線學習224
11.5 Bandit在線學習算法225
11.5.1 Bandit算法與推薦系統(tǒng)226
11.5.2 常用Bandit算法226
11.6 Bandit算法原理及實現228
11.7 GAN網絡229
11.7.1 GAN產生的背景230
11.7.2 模型結構230
11.7.3 GAN的實現原理232
11.8 DCGAN網絡236
11.8.1 模型結構236
11.8.2 反卷積237
11.9 DCGAN人臉生成240
11.9.1 實驗準備240
11.9.2 關鍵模塊的實現240
11.9.3 實驗結果展示243
11.10 本章小結245
附錄A 機器學習常見面試題246
附錄B 數學基礎257
B.1 常用符號257
B.2 數學基礎知識259
B.2.1 線性代數259
B.2.2 概率論261
B.2.3 信息論262
參考文獻264

本目錄推薦

掃描二維碼
Copyright ? 讀書網 www.dappsexplained.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號