注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡家庭與辦公軟件大數據分析:數據挖掘必備算法示例詳解

大數據分析:數據挖掘必備算法示例詳解

大數據分析:數據挖掘必備算法示例詳解

定 價:¥39.90

作 者: 張重生 著
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787111555469 出版時間: 2016-12-01 包裝: 平裝
開本: 16k 頁數: 字數:  

內容簡介

  本書詳細介紹了大數據分析,尤其是數據分類相關算法的原理及實現細節(jié),并給出了每個算法的編程實例。全書共計21章,內容包括十大數據分類算法、十大從二元分類到多類分類的算法、九大屬性選擇算法、五大數據選擇算法,若干集成學習方法和不均衡數據分類算法,以及大數據分析的平臺與技術。 本書可作為高等學校計算機科學與技術、數據科學與大數據技術、統計學、軟件工程、地理信息系統等專業(yè)的研究生和高年級本科生的教材,也可作為科研人員、工程師和大數據愛好者的參考書。

作者簡介

  張重生,男,博士,教授,碩士生導師,河南大學大數據團隊帶頭人。研究領域為大數據分析、深度學習、數據挖掘、數據庫、實時數據分析。博士畢業(yè)于 INRIA,France(法國國家信息與自動化研究所)。2010年08月至2011年3月,在美國加州大學洛杉磯分校(UCLA)計算機系,師從Carlo Zaniolo教授進行流數據挖掘方面的研究。 十多年來,一直從事數據庫、數據挖掘、大數據分析相關的研究,發(fā)表SCI/EI論文20篇,含Information Sciences、Neurocomputing、IEEE ICDM、PAKDD、SSDBM等國際期刊和會議論文。作為項目負責人主持 4項科研項目,出版學術專著3部,獲得3項國家發(fā)明專利,指導碩士研究生12名。

圖書目錄

第1章數據分析緒論
1.1理解數據中字段的類型是數據分析的重要前提
1.2進行數據分析時數據的表示形式
1.3數據分類——數據類別的自動識別
1.4數據分類問題與回歸問題的區(qū)別與聯系
1.5數據分析算法簡介
1.6交叉驗證
1.7一個最簡單的分類器-K近鄰分類器
1.8后續(xù)章節(jié)組織
第2章SVM算法
2.1算法原理
2.2工具包簡介
2.3實例詳解
第3章決策樹算法
3.1信息熵值
3.2決策樹的構建目標
3.3 ID3決策樹算法
3.4 C45決策樹算法
3.5 CART決策樹算法
3.6 ID3、C45、CART算法的終止條件
3.7C45算法的參數介紹
3.8實例詳解
第4章隨機森林算法
4.1算法原理
4.2工具包介紹
4.3實例詳解
第5章梯度提升決策樹算法
5.1算法原理
5.2工具包介紹
5.3實例詳解
第6章AdaBoost算法
6.1算法原理
6.2工具包介紹
6.3實例詳解
第7章樸素貝葉斯分類器
7.1樸素貝葉斯分類的問題定義
7.2樸素貝葉斯算法原理
7.3一種常見的樸素貝葉斯模型的錯誤計算方法
7.4樸素貝葉斯算法對連續(xù)型屬性的處理
第8章極限學習機器算法
8.1算法原理
8.2算法參數介紹
8.3實例詳解
第9章邏輯回歸算法
9.1 Logistic Regression算法流程
9.2 Logistic Regression算法原理推導
第10章稀疏表示分類算法
10.1算法原理
10.2 SRC工具包及算法參數介紹
10.3 SRC算法實例詳解
第11章不同數據分類算法性能的大規(guī)模實驗對比分析
11.1為什么要比較不同數據分類算法的性能?
11.2不同數據分類算法性能比較的相關工作
11.3最新數據分類算法性能的大規(guī)模實驗對比分析結果
11.4結論
第12章從二分類到多分類——OVA
12.1 OVA 聚合規(guī)則的核心思想
12.2 MAX聚合規(guī)則
12.3 DOO聚合規(guī)則
12.4調用示例
第13章從二分類到多分類——OVO
13.1 OVO 聚合規(guī)則的核心思想
13.2 WV聚合規(guī)則
13.3 VOTE聚合規(guī)則
13.4 PC聚合規(guī)則
13.5 PE聚合規(guī)則
13.6 LVPC聚合規(guī)則
13.7調用示例
第14章從二分類到多分類——ECOC
14.1 ECOC的核心思想
14.2 ECOC 編碼
14.3 ECOC 譯碼
14.4 ECOC多類分類調用示例
第15章三種從二分類到多分類聚合策略的實驗對比分析
15.1 OVA策略的實驗結果
15.2 OVO策略的實驗結果
15.3 ECOC策略的實驗結果
第16章多個分類算法的集成方法研究
16.1差異性(Diversity)的原理與技術
16.2集成學習方法
16.3本章小結
第17章屬性選擇算法
17.1 fspackage和LibSVM的使用
17.2信息增益算法
17.3卡方分布算法
17.4基于Fisher Score的屬性選擇算法
17.5基于基厄系數的屬性選擇算法
17.6基于T檢驗的屬性選擇算法
第18章高級屬性選擇算法
18.1線性前向選擇算法
18.2順序前向選擇算法
18.3基于稀疏多項式邏輯回歸的屬性選擇算法
18.4 Our——多個屬性選擇算法的集成策略
18.5屬性選擇算法的大規(guī)模實驗對比分析
第19章數據選擇算法
19.1衡量不均衡數據分類質量的常用方法
19.2 RUS算法
19.3 CNN算法
19.4 SMOTE算法
19.5 ADASYN算法
19.6 OSS算法
19.7本章小結
第20章不均衡數據分類算法及大規(guī)模實驗分析
20.1 C4.5 CS算法
20.2使用Random Forests和GBDT進行不均衡數據分類
20.3BalanceCascade不均衡數據分類算法
20.4其他不均衡數據分類算法及不均衡分類器的集成算法
20.5結合屬性選擇和數據選擇的不均衡數據分類實驗
第21章大數據分析
21.1 Spark平臺簡介
21.2基于Ambari的Spark及Spark集群的安裝與配置
21.3 Ambari集群擴展
21.4基于Spark平臺的分布式編程示例
21.5 MLlib——Spark平臺上的機器學習庫


本目錄推薦

掃描二維碼
Copyright ? 讀書網 www.dappsexplained.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號