注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡軟件與程序設計零基礎入門Python數(shù)據(jù)分析與機器學習

零基礎入門Python數(shù)據(jù)分析與機器學習

零基礎入門Python數(shù)據(jù)分析與機器學習

定 價:¥69.00

作 者: 王國平 著
出版社: 清華大學出版社
叢編項:
標 簽: 暫缺

ISBN: 9787302589174 出版時間: 2021-10-01 包裝: 平裝
開本: 16開 頁數(shù): 257 字數(shù):  

內(nèi)容簡介

  《零基礎入門Python數(shù)據(jù)分析與機器學習》由一線的資深數(shù)據(jù)分析師精寫,以新版Python3.10作為數(shù)據(jù)分析與挖掘的編程語言,循序漸進地介紹了Python數(shù)據(jù)分析的方法與技巧以及機器學習算法及其應用案例。《零基礎入門Python數(shù)據(jù)分析與機器學習》首先講解Python基礎語法,以便于從未接觸過編程的讀者能夠快速上手,然后介紹了當前流行的常用數(shù)據(jù)分析工具,如數(shù)值計算工具NumPy、數(shù)據(jù)處理工具Pandas、數(shù)據(jù)可視化工具Matplotlib和數(shù)據(jù)挖掘工具Sklearn等,最后介紹了10大常用機器學習算法及其在數(shù)據(jù)挖掘中的應用,針對每一個算法均給出了案例實現(xiàn),以便于讀者能夠?qū)W有所用?!读慊A入門Python數(shù)據(jù)分析與機器學習》凝聚編者十余年工作心得,以豐富實例介紹理論知識,并給出大量應用實踐,很適合初入數(shù)據(jù)分析職場的從業(yè)者提升技能,《零基礎入門Python數(shù)據(jù)分析與機器學習》也可以作為統(tǒng)計學、數(shù)學、經(jīng)濟學、金融學、管理學以及相關理工科專業(yè)的本科生、研究生的教學參考書?!读慊A入門Python數(shù)據(jù)分析與機器學習》特點:零基礎入手,精心設計的知識體系:《零基礎入門Python數(shù)據(jù)分析與機器學習》首先介紹Python3.10版本的基礎語法,并針對初學者構建數(shù)據(jù)分析與機器學習的實驗環(huán)境,以便初學者無障礙上手。全書內(nèi)容循序漸進,在精要介紹基礎語法之后,還介紹了當前流行的數(shù)據(jù)分析工具,最后介紹了機器學習算法在數(shù)據(jù)分析和挖掘中的應用。讀者通過閱讀《零基礎入門Python數(shù)據(jù)分析與機器學習》能夠整體上掌握數(shù)據(jù)分析的重要方法、工具與技術。全面介紹流行工具的使用,應對工作需求:《零基礎入門Python數(shù)據(jù)分析與機器學習》針對當前流行的數(shù)據(jù)分析工具分章介紹,包括數(shù)值計算工具NumPy、數(shù)據(jù)處理工具Pandas、數(shù)據(jù)可視化工具Matplotlib、數(shù)據(jù)建模工具Sklearn等。每一個工具都從基礎講起,并輔之以案例演示,讀者可以邊學邊練,快速掌握技能,其中很多案例都來自于工作實踐,可以真正提升讀者的實戰(zhàn)技能,以應對工作需求。詳細講解10大機器學習算法,并輔之以豐富的案例:《零基礎入門Python數(shù)據(jù)分析與機器學習》針對數(shù)據(jù)挖掘中經(jīng)常使用的算法進行了詳細的介紹,其中每一個算法首先介紹理論知識,然后給出算法在實際案例中的應用,理論與實踐并重,可以幫助讀者真正理解算法并加以應用,從而提升讀者數(shù)據(jù)分析和挖掘的綜合能力。配書資源豐富,大幅提升學習效率:為了方便讀者輕松、高效地學習《零基礎入門Python數(shù)據(jù)分析與機器學習》內(nèi)容,作者還為《零基礎入門Python數(shù)據(jù)分析與機器學習》錄制了全程教學視頻,針對各章內(nèi)容進行了詳細的講解,讀者掃描《零基礎入門Python數(shù)據(jù)分析與機器學習》提供的二維碼即可隨時隨地觀看,大幅提升學習效率?!读慊A入門Python數(shù)據(jù)分析與機器學習》還提供了全部實例的源代碼,所有源代碼均在Python3.10和相應編程工具環(huán)境下測試通過,讀者下載后可以直接調(diào)用,以方便上機演練。《零基礎入門Python數(shù)據(jù)分析與機器學習》還制作了精彩的PPT課件,旨在方便有教學需求的讀者使用。

作者簡介

  王國平,畢業(yè)于上海海洋大學,碩士,從業(yè)十余年,主要從事數(shù)據(jù)可視化、數(shù)據(jù)挖掘和大數(shù)據(jù)分析與研究等工作。精通Tableau.SPss、SPSS Modeler、Power BI等軟件,已出版《IBM SPSS Modeler數(shù)據(jù)與文本挖掘?qū)崙?zhàn)》《Microsoft Power BI數(shù)據(jù)可視化與數(shù)據(jù)分析》《Tableau數(shù)據(jù)可視化從入門到精通》《SPSS統(tǒng)計分析與行業(yè)應用實戰(zhàn)》等專著。

圖書目錄

目 錄
第1章 構建數(shù)據(jù)分析開發(fā)環(huán)境 1
1.1 數(shù)據(jù)分析概述 1
1.1.1 為什么要進行數(shù)據(jù)分析 1
1.1.2 數(shù)據(jù)分析的流程與思維 2
1.2 開發(fā)環(huán)境的構建 4
1.2.1 安裝Anaconda 5
1.2.2 安裝Jupyter庫 6
1.2.3 安裝PyCharm社區(qū)版 8
1.2.4 包管理工具 11
1.2.5 環(huán)境測試 12
1.3 必會的Python數(shù)據(jù)分析包 12
1.3.1 NumPy數(shù)組操作 13
1.3.2 Pandas數(shù)據(jù)清洗 13
1.3.3 Matplotlib數(shù)據(jù)可視化 14
1.3.4 Sklearn數(shù)據(jù)建模 16
1.4 一個簡單的數(shù)據(jù)分析案例 17
1.5 小結與課后練習 19
第2章 Python核心基礎 20
2.1 Python數(shù)據(jù)類型 20
2.1.1 數(shù)值類型 20
2.1.2 字符串類型 21
2.1.3 列表類型 23
2.1.4 元組類型 24
2.1.5 集合類型 25
2.1.6 字典類型 27
2.2 Python基礎語法 28
2.2.1 代碼行與縮進 28
2.2.2 條件if及if嵌套 29
2.2.3 循環(huán):while與for 30
2.2.4 格式化:format()與% 32
2.3 Python高階函數(shù) 34
2.3.1 map()函數(shù) 34
2.3.2 reduce()函數(shù) 35
2.3.3 filter()函數(shù) 36
2.3.4 sorted()函數(shù) 36
2.4 Python編程技巧 37
2.4.1 自動補全程序 37
2.4.2 變量值的互換 38
2.4.3 列表解析式 39
2.4.4 元素序列解包 40
2.5 小結與課后練習 41
第3章 Python數(shù)據(jù)分析基礎 42
3.1 數(shù)據(jù)的讀取 42
3.1.1 本地離線數(shù)據(jù) 42
3.1.2 Web在線數(shù)據(jù) 44
3.1.3 常用數(shù)據(jù)庫數(shù)據(jù) 45
3.2 數(shù)據(jù)的索引 46
3.2.1 創(chuàng)建與查看索引 46
3.2.2 索引重構與恢復 48
3.2.3 索引調(diào)整與排序 49
3.3 數(shù)據(jù)的切片 49
3.3.1 提取多列數(shù)據(jù) 50
3.3.2 提取多行數(shù)據(jù) 51
3.3.3 提取區(qū)域數(shù)據(jù) 51
3.4 數(shù)據(jù)的聚合 52
3.4.1 指定列數(shù)據(jù)統(tǒng)計 52
3.4.2 多字段分組統(tǒng)計 53
3.4.3 自定義聚合指標 54
3.5 小結與課后練習 55
第4章 NumPy數(shù)組操作 56
4.1 NumPy索引與切片 56
4.1.1 數(shù)組的索引 56
4.1.2 布爾型索引 57
4.1.3 花式索引 59
4.1.4 數(shù)組的切片 60
4.1.5 設置切片步長 61
4.2 NumPy維數(shù)變換 62
4.2.1 reshape()函數(shù) 62
4.2.2 shape()函數(shù) 63
4.2.3 resize()函數(shù) 64
4.2.4 ravel()函數(shù) 65
4.2.5 flatten()函數(shù) 66
4.3 NumPy廣播機制 67
4.3.1 廣播 67
4.3.2 廣播機制 68
4.3.3 廣播機制變化過程 69
4.3.4 廣播不兼容 70
4.4 NumPy矩陣運算 72
4.4.1 矩陣概述 72
4.4.2 矩陣的乘法 74
4.4.3 矩陣的內(nèi)積 74
4.4.4 矩陣的外積 75
4.5 小結與課后練習 77
第5章 Pandas數(shù)據(jù)清洗 78
5.1 重復值檢測與處理 78
5.1.1 重復值的檢測 78
5.1.2 重復值的處理 79
5.2 缺失值檢測與處理 80
5.2.1 缺失值的檢測 81
5.2.2 缺失值的處理 81
5.3 異常值檢測與處理 84
5.3.1 異常值的檢測 85
5.3.2 異常值的處理 86
5.4 金融數(shù)據(jù)的處理實戰(zhàn) 87
5.4.1 讀取上證指數(shù)數(shù)據(jù) 87
5.4.2 提取特定日期數(shù)據(jù) 88
5.4.3 填充非交易日數(shù)據(jù) 89
5.5 小結與課后練習 90
第6章 Matplotlib數(shù)據(jù)可視化 91
6.1 圖形參數(shù)設置 91
6.1.1 設置圖形線條 91
6.1.2 設置圖形坐標軸 94
6.1.3 設置圖形圖例 97
6.2 繪圖參數(shù)文件及主要函數(shù) 99
6.2.1 修改繪圖參數(shù)文件 99
6.2.2 主要繪圖函數(shù)簡介 100
6.2.3 繪圖函數(shù)應用案例——分析某企業(yè)2020年銷售額增長情況 101
6.3 Matplotlib圖形整合 102
6.3.1 subplot()函數(shù) 103
6.3.2 subplots()函數(shù) 104
6.3.3 圖形整合實戰(zhàn)——分析2020年某企業(yè)產(chǎn)品銷售的區(qū)域差異性 105
6.4 Matplotlib可視化案例 107
6.4.1 商品區(qū)域銷售額條形圖 107
6.4.2 商品每周利潤率折線圖 110
6.4.3 商品利潤貢獻率餅圖 112
6.5 小結與課后練習 114
第7章 Scikit-Learn機器學習 116
7.1 機器學習及其類型 116
7.1.1 機器學習的特點 116
7.1.2 機器學習的分類 117
7.1.3 機器學習的應用 119
7.2 Sklearn機器學習概述 120
7.2.1 Sklearn的基本概念 120
7.2.2 Sklearn的主要算法 121
7.2.3 選擇合適的算法 124
7.3 Sklearn機器學習流程 125
7.3.1 獲取數(shù)據(jù) 126
7.3.2 預處理數(shù)據(jù) 126
7.3.3 訓練模型 127
7.3.4 評估模型 128
7.3.5 優(yōu)化模型 128
7.3.6 應用模型 129
7.4 Sklearn自帶的數(shù)據(jù)集 129
7.4.1 鳶尾花數(shù)據(jù)集簡介 129
7.4.2 乳腺癌數(shù)據(jù)集簡介 131
7.4.3 波士頓房價數(shù)據(jù)集簡介 132
7.4.4 糖尿病數(shù)據(jù)集簡介 133
7.4.5 手寫數(shù)字數(shù)據(jù)集簡介 134
7.4.6 紅酒數(shù)據(jù)集簡介 135
7.5 小結與課后練習 136
第8章 監(jiān)督式機器學習 137
8.1 線性回歸及其案例 137
8.1.1 線性回歸簡介 137
8.1.2 線性回歸的建模 138
8.1.3 汽車價格的預測 141
8.2 邏輯回歸及其案例 145
8.2.1 邏輯回歸簡介 146
8.2.2 邏輯回歸的建模 146
8.2.3 客戶收入的預測 147
8.3 Lasso回歸與Ridge回歸 151
8.3.1 Lasso回歸及案例 151
8.3.2 Ridge回歸及案例 153
8.3.3 兩種回歸的比較 154
8.4 決策樹及其案例 155
8.4.1 決策樹簡介 155
8.4.2 決策樹的建模 158
8.4.3 蘑菇類型的預測 159
8.5 K近鄰算法及其案例 166
8.5.1 K近鄰算法簡介 166
8.5.2 K近鄰算法的建模 166
8.5.3 乳腺癌患者的分類 168
8.6 支持向量機及其案例 169
8.6.1 支持向量機簡介 169
8.6.2 支持向量機的建模 170
8.6.3 乳腺癌患者的分類 172
8.7 小結與課后練習 174
第9章 無監(jiān)督式機器學習 175
9.1 聚類分析及其案例 175
9.1.1 K均值聚類算法及案例 175
9.1.2 使用手肘法判斷聚類數(shù) 180
9.1.3 輪廓系數(shù)法判斷聚類數(shù) 181
9.2 因子分析及其案例 185
9.2.1 因子分析概述 185
9.2.2 因子分析的建模 186
9.2.3 地區(qū)競爭力的因子分析 187
9.3 主成分分析及其案例 193
9.3.1 主成分分析概述 193
9.3.2 主成分分析的建模 194
9.3.3 乳腺癌患者的主成分分析 195
9.4 關聯(lián)分析及其案例 198
9.4.1 關聯(lián)分析概述 198
9.4.2 關聯(lián)分析的建模 199
9.4.3 電商商品購物籃分析 200
9.5 離群點檢測及其案例 203
9.5.1 離群點檢測概述 203
9.5.2 橢圓模型擬合及案例 204
9.5.3 局部離群因子及案例 207
9.6 雙聚類分析及其案例 211
9.6.1 雙聚類分析概述 211
9.6.2 聯(lián)合譜聚類及案例 211
9.6.3 譜雙聚類及案例 213
9.7 小結與課后練習 216
第10章 模型評估與調(diào)優(yōu) 217
10.1 機器學習的挑戰(zhàn) 217
10.2 模型的評估方法 219
10.3 模型的調(diào)優(yōu)方法 231
10.4 小結與課后練習 236
第11章 Python中文文本分析 237
11.1 中文結巴分詞 237
11.2 中文關鍵詞提取 240
11.3 中文詞向量生成 242
11.4 中文情感分析 245
11.5 小結與課后練習 249
附錄A Python 3.10.0及第三方庫安裝 250
附錄B Python常用第三方工具包簡介 254

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.dappsexplained.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號