注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡網絡與數據通信網絡服務Python大數據分析算法與實例

Python大數據分析算法與實例

Python大數據分析算法與實例

定 價:¥69.00

作 者: 鄧立國 著
出版社: 清華大學出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787302551065 出版時間: 2020-05-01 包裝: 平裝
開本: 16開 頁數: 332 字數:  

內容簡介

  大數據時代,大數據分析是關鍵技術。Python是一款優(yōu)秀的大數據分析軟件,《Python大數據分析算法與實例》以Python 3結合第三方開源工具進行大數據分析,以小的代價編程實現(xiàn)數據的提取、處理、分析和可視化。 全書分為8章,首先介紹大數據分析的背景和行業(yè)應用,給出了數據特征算法分析;然后基于Python 3介紹常用典型第三方大數據分析工具的場景應用;最后比較翔實地闡述大數據分析算法與經典實例應用?! 禤ython大數據分析算法與實例》適合從事大數據分析的研究人員、計算機或數學等相關專業(yè)的從業(yè)者參考學習,也可以作為計算機或數學等專業(yè)本科高年級或研究生的專業(yè)用書。

作者簡介

  鄧立國,東北大學計算機應用博士畢業(yè)。2005年開始在沈陽師范大學軟件學院、教育技術學院任教,主要研究方向:數據挖掘、知識工程、大數據處理、云計算、分布式計算等。以第一作者發(fā)表學術論文30多篇(26篇EI),主編教材 1 部,主持科研課題6項,經費10余萬元,多次獲得校級科研優(yōu)秀獎,作為九三社員提出的智慧城市提案被市政府采納,研究成果被教育廳等單位采用。

圖書目錄

目 錄

第1章 大數據分析概述 1
1.1 大數據分析背景 1
1.2 大數據分析的應用 2
1.3 大數據分析算法 3
1.4 大數據分析工具 6
1.5 本章小結 9
第2章 數據特征算法分析 10
2.1 數據分布性分析 10
2.1.1 數據分布特征集中趨勢的測定 10
2.1.2 數據分布特征離散程度的測定 15
2.1.3 數據分布特征偏態(tài)與峰度的測定 19
2.2 數據相關性分析 21
2.2.1 數據相關關系 21
2.2.2 數據相關分析的主要內容 24
2.2.3 相關關系的測定 24
2.3 數據聚類性分析 26
2.3.1 聚類分析定義 26
2.3.2 聚類類型 27
2.3.3 聚類應用 29
2.4 數據主成分分析 29
2.4.1 主成分分析的原理及模型 30
2.4.2 數據主成分分析的幾何解釋 31
2.4.3 數據主成分的導出 32
2.4.4 證明主成分的方差是依次遞減的 34
2.4.5 數據主成分分析的計算 35
2.5 數據動態(tài)性分析 36
2.6 數據可視化 40
2.7 本章小結 42
第3章 大數據分析工具:NumPy 43
3.1 NumPy簡介 43
3.2 NumPy環(huán)境安裝配置 44
3.3 ndarray對象 45
3.4 數據類型 47
3.5 數組屬性 49
3.6 數組創(chuàng)建例程 52
3.7 切片和索引 57
3.8 廣播 60
3.9 數組操作與迭代 61
3.10 位操作與字符串函數 87
3.11 數學運算函數 91
3.12 算數運算 93
3.13 統(tǒng)計函數 97
3.14 排序、搜索和計數函數 101
3.15 字節(jié)交換 104
3.16 副本和視圖 105
3.17 矩陣庫 107
3.18 線性代數模塊 109
3.19 Matplotlib庫 112
3.20 Matplotlib 繪制直方圖 114
3.21 IO文件操作 116
3.22 NumPy實例:GPS定位 117
3.23 本章小結 120
第4章 大數據分析工具:SciPy 121
4.1 SciPy簡介 121
4.2 文件輸入和輸出:SciPy.io 122
4.3 特殊函數:SciPy.special 123
4.4 線性代數操作:SciPy.linalg 124
4.5 快速傅里葉變換:sipy.fftpack 124
4.6 優(yōu)化器:SciPy.optimize 125
4.7 統(tǒng)計工具:SciPy.stats 126
4.8 SciPy實例 127
4.8.1 最小二乘擬合 127
4.8.2 函數最小值 128
4.9 本章小結 130
第5章 大數據分析工具:Matplotlib 131
5.1 初級繪制 131
5.2 圖像、子區(qū)、子圖、刻度 137
5.3 其他種類的繪圖 140
5.4 本章小結 147
第6章 大數據分析工具:Pandas 148
6.1 Pandas系列 148
6.2 Pandas數據幀 151
6.3 Pandas面板 155
6.4 Pandas快速入門 158
6.5 本章小結 172
第7章 大數據分析工具:Statsmodels與Gensim 173
7.1 Statsmodels 173
7.1.1 Statsmodels統(tǒng)計數據庫 173
7.1.2 Statsmodels典型的擬合模型概述 175
7.1.3 Statsmodels舉例 176
7.2 Gensim 178
7.2.1 基本概念 178
7.2.2 訓練語料的預處理 179
7.2.3 主題向量的變換 180
7.2.4 文檔相似度的計算 181
7.3 本章小結 182
第8章 大數據分析算法與實例 183
8.1 描述統(tǒng)計 183
8.2 假設檢驗 188
8.3 信度分析 192
8.4 列聯(lián)表分析 195
8.5 相關分析 196
8.6 方差分析 198
8.6.1 單因素方差分析 199
8.6.2 多因素方差分析 201
8.7 回歸分析 203
8.8 聚類分析 207
8.9 判別分析 212
8.10 主成分分析 216
8.11 因子分析 218
8.12 時間序列分析 221
8.13 生存分析 224
8.14 典型相關分析 245
8.15 RoC分析 250
8.16 距離分析 255
8.17 對應分析 264
8.18 決策樹分析 265
8.19 神經網絡-深度學習 271
8.19.1 深度學習的基本模型 271
8.19.2 新聞分類實例 275
8.20 蒙特·卡羅模擬 280
8.20.1 蒙特·卡羅模擬基本模型 281
8.20.2 蒙特·卡羅模擬計算看漲期權實例 281
8.21 關聯(lián)規(guī)則 287
8.21.1 關聯(lián)規(guī)則的概念 288
8.21.2 Apriori算法及實例 289
8.21.3 FP樹頻集算法 292
8.22 Uplift Modeling 301
8.23 集成方法 306
8.24 異常檢測 311
8.25 文本挖掘 315
8.26 Boosting算法(提升法和Gradient Boosting) 322
8.27 本章小結 325
參考文獻 326

本目錄推薦

掃描二維碼
Copyright ? 讀書網 www.dappsexplained.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號