注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡(luò)數(shù)據(jù)庫數(shù)據(jù)挖掘?qū)д?/a>

數(shù)據(jù)挖掘?qū)д?/h1>

定 價:¥28.00

作 者: 戴紅、常子冠、于寧 著
出版社: 清華大學出版社
叢編項:
標 簽: 工學 教材 研究生/本科/??平滩?/td>

ISBN: 9787302381044 出版時間: 2014-11-01 包裝: 平裝
開本: 16 頁數(shù): 207 字數(shù):  

內(nèi)容簡介

  本書為數(shù)據(jù)挖掘入門級教材,共分8章,主要內(nèi)容分為三個專題:技術(shù)、數(shù)據(jù)和評估。技術(shù)專題包括決策樹技術(shù)、K-means算法、關(guān)聯(lián)分析技術(shù)、神經(jīng)網(wǎng)絡(luò)技術(shù)、回歸分析技術(shù)、貝葉斯分析、凝聚聚類、概念分層聚類、混合模型聚類技術(shù)的EM算法、時間序列分析和基于Web的數(shù)據(jù)挖掘等常用的機器學習方法和統(tǒng)計技術(shù)。數(shù)據(jù)專題包括數(shù)據(jù)庫中的知識發(fā)現(xiàn)處理模型和數(shù)據(jù)倉庫及OLAP技術(shù)。評估專題包括利用檢驗集分類正確率和混淆矩陣,并結(jié)合檢驗集置信區(qū)間評估有指導學習模型,使用無指導聚類技術(shù)評估有指導模型,利用Lift和假設(shè)檢驗比較兩個有指導學習模型,使用MS Excel 2010和經(jīng)典的假設(shè)檢驗?zāi)P驮u估屬性,使用簇質(zhì)量度量方法和有指導學習技術(shù)評估無指導聚類模型。本書秉承教材風格,強調(diào)廣度講解。注重成熟模型和開源工具的使用,以提高學習者的應(yīng)用能力為目標;注重結(jié)合實例和實驗,加強基本概念和原理的理解和運用;注重實例的趣味性和生活性,提高學習者學習的積極性。使用章后練習、計算和實驗作業(yè)鞏固和檢驗所學內(nèi)容;使用詞匯表附錄,解釋和規(guī)范數(shù)據(jù)挖掘?qū)W科專業(yè)術(shù)語;使用適合教學的簡單易用開源的Weka和通用的MS Excel軟件工具實施數(shù)據(jù)挖掘驗證和體驗數(shù)據(jù)挖掘的精妙。本書可作為普通高等院校計算機科學、信息科學、數(shù)學和統(tǒng)計學專業(yè)的入門教材,也可作為如經(jīng)濟學、管理學、檔案學等對數(shù)據(jù)管理、數(shù)據(jù)分析與數(shù)據(jù)挖掘有教學需求的其他相關(guān)專業(yè)的基礎(chǔ)教材。同時,對數(shù)據(jù)挖掘技術(shù)和方法感興趣,致力于相關(guān)方面的研究和應(yīng)用的其他讀者,也可以從本書中獲取基本的指導和體驗。本書配有教學幻燈片、大部分章后習題和實驗的參考答案以及課程大綱。

作者簡介

暫缺《數(shù)據(jù)挖掘?qū)д摗纷髡吆喗?/div>

圖書目錄

第1章 認識數(shù)據(jù)挖掘 1
1.1 數(shù)據(jù)挖掘的定義 1
1.2 機器學習 2
1.2.1 概念學習 2
1.2.2 歸納學習 3
1.2.3 有指導的學習 4
1.2.4 無指導的聚類 7
1.3 數(shù)據(jù)查詢 8
1.4 專家系統(tǒng) 8
1.5 數(shù)據(jù)挖掘的過程 9
1.5.1 準備數(shù)據(jù) 10
1.5.2 挖掘數(shù)據(jù) 10
1.5.3 解釋和評估數(shù)據(jù) 10
1.5.4 模型應(yīng)用 11
1.6 數(shù)據(jù)挖掘的作用 11
1.6.1 分類 11
1.6.2 估計 12
1.6.3 預測 12
1.6.4 無指導聚類 12
1.6.5 關(guān)聯(lián)關(guān)系分析 13
1.7 數(shù)據(jù)挖掘技術(shù) 13
1.7.1 神經(jīng)網(wǎng)絡(luò) 14
1.7.2 回歸分析 14
1.7.3 關(guān)聯(lián)分析 15
1.7.4 聚類技術(shù) 16
1.8 數(shù)據(jù)挖掘的應(yīng)用 16
1.8.1 應(yīng)用領(lǐng)域 16
1.8.2 成功案例 18
1.9 Weka數(shù)據(jù)挖掘軟件 19
1.9.1 Weka簡介 19
1.9.2 使用Weka建立決策樹模型 22
1.9.3 使用Weka進行聚類 25
1.9.4 使用Weka進行關(guān)聯(lián)分析 26
本章小結(jié) 27
習題 28
第2章 基本數(shù)據(jù)挖掘技術(shù) 30
2.1 決策樹 30
2.1.1 決策樹算法的一般過程 31
2.1.2 決策樹算法的關(guān)鍵技術(shù) 32
2.1.3 決策樹規(guī)則 40
2.1.4 其他決策樹算法 41
2.1.5 決策樹小結(jié) 41
2.2 關(guān)聯(lián)規(guī)則 42
2.2.1 關(guān)聯(lián)規(guī)則概述 42
2.2.2 關(guān)聯(lián)分析 43
2.2.3 關(guān)聯(lián)規(guī)則小結(jié) 46
2.3 聚類分析技術(shù) 47
2.3.1 K-means算法 48
2.3.2 K-means算法小結(jié) 51
2.4 數(shù)據(jù)挖掘技術(shù)的選擇 51
本章小結(jié) 52
習題 53
第3章 數(shù)據(jù)庫中的知識發(fā)現(xiàn) 55
3.1 知識發(fā)現(xiàn)的基本過程 55
3.1.1 KDD過程模型 55
3.1.2 知識發(fā)現(xiàn)軟件 57
3.1.3 KDD過程的參與者 58
3.2 KDD過程模型的應(yīng)用 58
3.2.1 步驟1:商業(yè)理解 58
3.2.2 步驟2:數(shù)據(jù)理解 59
3.2.3 步驟3:數(shù)據(jù)準備 60
3.2.4 步驟4:建模 65
3.2.5 評估 66
3.2.6 部署和采取行動 66
3.3 實驗:KDD案例 66
本章小結(jié) 72
習題 73
第4章 數(shù)據(jù)倉庫 74
4.1 數(shù)據(jù)庫與數(shù)據(jù)倉庫 74
4.1.1 數(shù)據(jù)(庫)模型 75
4.1.2 規(guī)范化與反向規(guī)范化 77
4.2 設(shè)計數(shù)據(jù)倉庫 79
4.2.1 數(shù)據(jù)抽取、清洗、變換和加載 79
4.2.2 數(shù)據(jù)倉庫模型 82
4.2.3 數(shù)據(jù)集市 85
4.2.4 決策支持系統(tǒng) 86
4.3 聯(lián)機分析處理 87
4.3.1 概述 87
4.3.2 實驗:使用OLAP輔助駕駛員行為分析 90
4.4 使用Excel數(shù)據(jù)透視表和數(shù)據(jù)透視圖分析數(shù)據(jù) 93
4.4.1 創(chuàng)建簡單數(shù)據(jù)透視表和透視圖 93
4.4.2 創(chuàng)建多維透視表和透視圖 97
本章小結(jié) 100
習題 100
第5章 評估技術(shù) 102
5.1 數(shù)據(jù)挖掘評估概述 102
5.1.1 評估內(nèi)容 102
5.1.2 評估工具 103
5.2 評估有指導學習模型 108
5.2.1 評估分類類型輸出模型 108
5.2.2 評估數(shù)值型輸出模型 109
5.2.3 計算檢驗集置信區(qū)間 111
5.2.4 無指導聚類技術(shù)的評估作用 112
5.3 比較有指導學習模型 112
5.3.1 使用Lift比較模型 112
5.3.2 通過假設(shè)檢驗比較模型 114
5.4 屬性評估 115
5.4.1 數(shù)值型屬性的冗余檢查 115
5.4.2 數(shù)值屬性顯著性的假設(shè)檢驗 117
5.5 評估無指導聚類模型 118
本章小結(jié) 118
習題 119
第6章 神經(jīng)網(wǎng)絡(luò)技術(shù) 120
6.1 神經(jīng)網(wǎng)絡(luò)概述 120
6.1.1 神經(jīng)網(wǎng)絡(luò)模型 120
6.1.2 神經(jīng)網(wǎng)絡(luò)的輸入和輸出數(shù)據(jù)格式 121
6.1.3 激勵函數(shù) 123
6.2 神經(jīng)網(wǎng)絡(luò)訓練 124
6.2.1 反向傳播學習 124
6.2.2 自組織映射的無指導聚類 127
6.2.3 實驗:應(yīng)用BP算法建立前饋神經(jīng)網(wǎng)絡(luò) 130
6.3 神經(jīng)網(wǎng)絡(luò)模型的優(yōu)勢和缺點 138
本章小結(jié) 138
習題 139
第7章 統(tǒng)計技術(shù) 141
7.1 回歸分析 141
7.1.1 線性回歸分析 142
7.1.2 非線性回歸 149
7.1.3 樹回歸 151
7.2 貝葉斯分析 152
7.3 聚類技術(shù) 156
7.3.1 分層聚類 156
7.3.2 基于模型的聚類 163
7.4 數(shù)據(jù)挖掘中的統(tǒng)計技術(shù)與機器學習技術(shù) 165
本章小結(jié) 165
習題 167
第8章 時間序列和基于Web的數(shù)據(jù)挖掘 169
8.1 時間序列分析 169
8.1.1 概述 169
8.1.2 線性回歸分析解決時間序列問題 173
8.1.3 神經(jīng)網(wǎng)絡(luò)技術(shù)解決時間序列問題 175
8.2 基于Web的數(shù)據(jù)挖掘 176
8.2.1 概述 176
8.2.2 Web文本挖掘 178
8.2.3 Web使用挖掘 179
8.3 多模型分類技術(shù) 185
8.3.1 裝袋技術(shù) 185
8.3.2 推進技術(shù) 185
本章小結(jié) 186
習題 187
附錄A 詞匯表 188
附錄B 數(shù)據(jù)挖掘數(shù)據(jù)集 201
參考文獻
Copyright ? 讀書網(wǎng) www.dappsexplained.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號