注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術工業(yè)技術建筑科學建筑設計Python數(shù)據(jù)挖掘方法及應用

Python數(shù)據(jù)挖掘方法及應用

Python數(shù)據(jù)挖掘方法及應用

定 價:¥49.00

作 者: 王斌會
出版社: 電子工業(yè)出版社
叢編項:
標 簽: 暫缺

ISBN: 9787121344954 出版時間: 2019-03-01 包裝: 平裝
開本: 16開 頁數(shù): 216 字數(shù):  

內(nèi)容簡介

  本書重點介紹Python語言在數(shù)據(jù)處理與數(shù)據(jù)挖掘方面的應用技巧,主要包括數(shù)據(jù)分析基礎知識(數(shù)據(jù)收集與分析軟件、數(shù)據(jù)挖掘的分析基礎、簡單數(shù)據(jù)的統(tǒng)計分析),數(shù)據(jù)分析高級方法(多元數(shù)據(jù)的綜合分析、時序數(shù)據(jù)的模型分析),大數(shù)據(jù)基本處理方法(大數(shù)據(jù)分析基礎應用、文獻計量與科研評價、社會網(wǎng)絡分析方法、數(shù)據(jù)分析編程平臺)等內(nèi)容。附錄中還提供了Python數(shù)據(jù)分析相關方法和函數(shù)等,方便讀者隨時查看。本書內(nèi)容豐富,圖文并茂,可操作性強且便于查閱,主要面向數(shù)據(jù)分析的讀者,能有效幫助讀者提高數(shù)據(jù)處理與分析的水平,提升工作效率。書中的例子數(shù)據(jù)、習題數(shù)據(jù)及相關代碼都可在作者的學習博客http://blog.leanote.com/DaPy下載使用,也可登錄華信教育資源網(wǎng)http://www.hxedu.com.cn免費下載。本書適合各層次的數(shù)據(jù)分析用戶,既可作為初學者的入門指南,又可作為中高級用戶的參考手冊,同時也可作為各大中專院校和培訓班的數(shù)據(jù)分析教材。

作者簡介

  暨南大學教授,中國統(tǒng)計學會會員,廣東省統(tǒng)計學會常務理事,暨南大學統(tǒng)計學專業(yè)博士生導師。著有多部統(tǒng)計學教材或?qū)V?/div>

圖書目錄

目    錄
第一部分  數(shù)據(jù)分析基礎知識
第1章  數(shù)據(jù)收集與分析軟件 2
1.1  數(shù)據(jù)收集過程 2
1.1.1  數(shù)據(jù)的類型 2
1.1.2  數(shù)據(jù)的收集 3
1.1.3  數(shù)據(jù)的管理 8
1.2  數(shù)據(jù)分析軟件 9
1.2.1  數(shù)據(jù)分析軟件簡介 9
1.2.2  Python語言介紹 10
1.2.3  Python在線平臺 13
1.3  Python編程基礎 18
1.3.1  Python編程入門 18
1.3.2  Python數(shù)據(jù)類型 20
1.3.3  數(shù)值分析包numpy 24
1.3.4  數(shù)據(jù)分析包pandas 25
1.3.5  Python編程運算 34
數(shù)據(jù)及練習1 38
第2章  數(shù)據(jù)挖掘的分析基礎 41
2.1  數(shù)據(jù)的描述分析 41
2.1.1  基本統(tǒng)計量 41
2.1.2  基本繪圖函數(shù) 46
2.2  數(shù)據(jù)的透視分析 55
2.2.1  一維頻數(shù)分析 56
2.2.2  二維集聚分析 57
2.2.3  多維透視分析 60
數(shù)據(jù)及練習2 62
第3章  簡單數(shù)據(jù)的統(tǒng)計分析 64
3.1  隨機變量及其分布 64
3.1.1  均勻分布 64
3.1.2  正態(tài)分布 65
3.2  隨機模擬及其應用 67
3.2.1  隨機模擬方法 67
3.2.2  模擬大數(shù)定律 68
3.2.3  模擬方法求積分 69
3.3  單變量統(tǒng)計分析模型 70
3.3.1  單變量線性相關模型 71
3.3.2  單變量線性回歸模型 73
數(shù)據(jù)及練習3 75
第二部分  數(shù)據(jù)分析高級方法
第4章  多元數(shù)據(jù)的綜合分析 78
4.1  多元線性相關與回歸 79
4.1.1  多元線性相關 79
4.1.2  多元線性回歸模型 81
4.2  綜合評價方法 91
4.2.1  綜合評價指標體系 91
4.2.2  綜合評價分析方法 93
4.3  數(shù)據(jù)壓縮方法 99
4.3.1  主成分分析的基本思想 99
4.3.2  主成分的基本分析 101
4.4  聚類分析方法 105
4.4.1  聚類分析的概念 105
4.4.2  系統(tǒng)聚類方法 108
數(shù)據(jù)與練習4 113
第5章  時序數(shù)據(jù)的模型分析 116
5.1  時間序列簡介 116
5.1.1  時間序列的概念 116
5.1.2  時間序列的模擬 116
5.1.3  時間序列的讀取 118
5.2  時間序列分析模型 119
5.2.1  AR模型 120
5.2.2  MR模型 120
5.2.3  ARMA模型 121
5.2.4  ARIMA模型 122
5.3  ARMA模型的構建 124
5.3.1  序列的相關性檢驗 124
5.3.2  ARMA模型的建立與檢驗 127
5.3.3  序列的平穩(wěn)性檢驗 131
5.4  股票指數(shù)預測模型的構建 133
5.4.1  模型的預處理 134
5.4.2  參數(shù)的估計與檢驗 135
5.4.3  模型的預測 136
數(shù)據(jù)與練習5 137
第三部分  大數(shù)據(jù)基本處理方法
第6章  大數(shù)據(jù)分析基礎應用 140
6.1  大數(shù)據(jù)的概念 140
6.1.1  大數(shù)據(jù)的含義 140
6.1.2  大數(shù)據(jù)應用舉例 141
6.1.3  大數(shù)據(jù)分析方法 142
6.2  Python文本預處理 144
6.2.1  字符串的基本操作 144
6.2.2  字符串查詢與替換 146
6.3  網(wǎng)絡爬蟲及應用 146
6.3.1  網(wǎng)頁的基礎知識 147
6.3.2  Python爬蟲步驟 148
6.3.3  爬蟲方法的應用 149
6.4  數(shù)據(jù)庫技術及應用 154
6.4.1  Python中數(shù)據(jù)庫的使用 154
6.4.2  數(shù)據(jù)庫的建立與使用 155
數(shù)據(jù)及練習6 156
第7章  文獻計量與科研評價 159
7.1  文獻計量研究的框架 159
7.2  文獻數(shù)據(jù)的獲取與分析 161
7.2.1  文獻數(shù)據(jù)的獲取 161
7.2.2  文獻數(shù)據(jù)的分析 163
7.3  科研數(shù)據(jù)的管理與評價 166
7.3.1  科研單位與項目分析 167
7.3.2  科研期刊與作者分析 169
數(shù)據(jù)及練習7 171
第8章  社會網(wǎng)絡分析方法 172
8.1  社會網(wǎng)絡的初步印象 172
8.1.1  社會網(wǎng)絡分析概念 172
8.1.2  社會網(wǎng)絡分析包 174
8.2  社會網(wǎng)絡圖的構建 174
8.2.1  社會網(wǎng)絡數(shù)據(jù)形式 174
8.2.2  社會網(wǎng)絡統(tǒng)計量 177
8.2.3  網(wǎng)絡圖之知識圖譜 180
數(shù)據(jù)及練習8 183
第9章  數(shù)據(jù)分析編程平臺 185
9.1  Anaconda科學計算發(fā)行包 185
9.1.1  Anaconda下載與安裝 185
9.1.2  Anaconda啟動與運行 186
9.2  Jupyter編輯平臺 188
9.2.1  Jupyter Notebook 188
9.2.2  Jupyter Lab 193
9.2.3  在Jupyter中使用R語言 196
9.3  Spyder分析平臺 197
9.3.1  Spyder平臺簡介 197
9.3.2  Spyder平臺使用 198
附錄A  本書的學習網(wǎng)站 200
附錄B  書中的例子數(shù)據(jù) 201
附錄C  書中自定義函數(shù) 202
參考文獻 205

Copyright ? 讀書網(wǎng) www.dappsexplained.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號