注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡數(shù)據(jù)庫數(shù)據(jù)挖掘基礎

數(shù)據(jù)挖掘基礎

數(shù)據(jù)挖掘基礎

定 價:¥48.00

作 者: 劉鵬,張燕,陶建輝,姜才康 著
出版社: 清華大學出版社
叢編項: 大數(shù)據(jù)應用人才培養(yǎng)系列教材
標 簽: 暫缺

購買這本書可以去


ISBN: 9787302502197 出版時間: 2018-07-01 包裝: 平裝
開本: 16 頁數(shù): 170 字數(shù):  

內容簡介

  本書介紹了數(shù)據(jù)挖掘的基本概念,包括數(shù)據(jù)挖掘的常用算法、常用工具、用途和應用場景及應用狀況, 講述了常用數(shù)據(jù)挖掘方法,如分類、聚類、關聯(lián)規(guī)則的概念、思想、典型算法、應用場景等。此外,本書 還從實際應用出發(fā),講解了基于日志的大數(shù)據(jù)挖掘技術的原理、工具、應用場景和成功案例。日志挖掘技 術現(xiàn)在已得到了廣泛的運用。 通過以上內容的學習,讀者將了解數(shù)據(jù)挖掘的基本概念、思想和算法,并掌握其應用要領。本書可以 作為培養(yǎng)應用型人才的課程教材,也可作為相關開發(fā)人員的自學教材和參考手冊。

作者簡介

  陶建輝,現(xiàn)任IT信息科技公司總經理,歷任數(shù)據(jù)服務公司(上海市大數(shù)據(jù)產業(yè)技術創(chuàng)新戰(zhàn)略聯(lián)盟成員單位)副總經理、DEC/Compaq/HP技術顧問、高級技術顧問、部署研究所課題組長等。 復旦大學計算機軟件學士、碩士,27年IT從業(yè)經驗,包括信息系統(tǒng)的分析、設計、開發(fā)和運維等。

圖書目錄

第1章 數(shù)據(jù)挖掘概念
1.1 數(shù)據(jù)挖掘概述
1.1.1 什么是數(shù)據(jù)挖掘
1.1.2 數(shù)據(jù)挖掘常用算法概述
1.1.3 數(shù)據(jù)挖掘常用工具概述
1.2 數(shù)據(jù)探索
1.2.1 數(shù)據(jù)概述
1.2.2 數(shù)據(jù)質量
1.2.3 數(shù)據(jù)預處理
1.3 數(shù)據(jù)挖掘的應用
1.3.1 數(shù)據(jù)挖掘現(xiàn)狀及發(fā)展趨勢
1.3.2 數(shù)據(jù)挖掘需要解決的問題
1.3.3 數(shù)據(jù)挖掘的應用場景
1.4 作業(yè)與練習
參考文獻
第2章 分類
2.1 分類概述
2.1.1 分類的基本概念
2.1.2 解決分類問題的一般方法
2.1.3 決策樹
案例:Web機器人檢測
2.1.4 模型的過分擬合
2.2 貝葉斯決策與分類器
2.2.1 規(guī)則分類器
2.2.2 分類中貝葉斯定理的應用
2.2.3 分類中樸素貝葉斯的應用
2.3 支持向量機
2.3.1 最大邊緣超平面
2.3.2 線性支持向量機SVM
2.3.3 非線性支持向量機SVM
2.4 分類在實際場景中的應用案例
案例一:如何解決文章主題關鍵字與搜索引擎關鍵字帶來的檢索結果差異
案例二:甄別新金融交易方式的欺詐行為
案例三:在線廣告推薦中的分類
2.5 作業(yè)與練習
參考文獻
第3章 聚類
3.1 聚類概述
3.1.1 聚類的基本概念
3.1.2 聚類算法
3.2 聚合分析方法
3.2.1 歐氏距離
3.2.2 聚合過程
3.2.3 聚類樹
3.2.4 聚合分析方法應用例子
3.3 聚類在實際場景中的應用案例
3.4 聚類的實現(xiàn)例子
3.5 作業(yè)與練習
參考文獻
第4章 關聯(lián)規(guī)則
4.1 關聯(lián)規(guī)則概述
4.1.1 經典案例導入
4.1.2 關聯(lián)規(guī)則的基本概念和定義
4.1.3 關聯(lián)規(guī)則的分類
4.2 關聯(lián)規(guī)則的挖掘過程
4.2.1 知識回顧
4.2.2 頻繁項集產生
4.2.3 強關聯(lián)規(guī)則
4.2.4 關聯(lián)規(guī)則評價標準
4.3 關聯(lián)規(guī)則的Apriori算法
4.3.1 知識回顧
4.3.2 Apriori算法的核心思想
4.3.3 Apriori算法描述
4.3.4 Apriori算法評價
4.3.5 Apriori算法改進
4.4 關聯(lián)規(guī)則的FP-growth算法
4.4.1 構建FP樹
4.4.2 從FP樹中挖掘頻繁項集
4.5 實戰(zhàn):關聯(lián)規(guī)則挖掘實例
4.5.1 關聯(lián)規(guī)則挖掘技術在國內外的應用現(xiàn)狀
4.5.2 關聯(lián)規(guī)則應用實例
4.5.3 關聯(lián)規(guī)則在大型超市中應用的步驟
4.6 作業(yè)與練習
參考文獻
第5章 綜合實戰(zhàn)—日志的挖掘與應用
5.1 日志概念
5.1.1 日志是什么
5.1.2 日志能做什么
5.2 日志處理
5.2.1 產生日志
5.2.2 傳輸日志
5.2.3 存儲日志
5.2.4 分析日志
5.2.5 日志規(guī)范與標準
5.3 日志分析原理及工具
5.3.1 日志分析原理
5.3.2 日志分析工具
5.3.3 日志分析系統(tǒng)規(guī)劃建設
5.4 日志挖掘應用
5.4.1 安全運維
5.4.2 系統(tǒng)健康分析
5.4.3 用戶行為分析
5.4.4 業(yè)務分析設計
5.5 日志分析挖掘實例
5.6 作業(yè)與練習
參考文獻
第6章 數(shù)據(jù)挖掘應用案例
6.1 電力行業(yè)采用聚類方法進行主變油溫分析
6.1.1 需求背景及采用的大數(shù)據(jù)分析方法
6.1.2 大數(shù)據(jù)分析方法的實現(xiàn)過程
6.1.3 大數(shù)據(jù)分析方法的實現(xiàn)結果
6.2 銀行信貸評價
6.2.1 簡介
6.2.2 神經網絡模型
6.2.3 實證檢驗
6.3 指數(shù)預測
6.3.1 金融時間序列概況
6.3.2 小波消噪
6.3.3 向量機
6.3.4 指數(shù)預測
6.4 客戶分群的精準智能營銷
6.4.1 挖掘目標
6.4.2 分析方法和過程
6.4.3 建模仿真
6.5 使用WEKA進行房屋定價
6.6 作業(yè)與練習
參考文獻
附錄A 大數(shù)據(jù)和人工智能實驗環(huán)境
附錄B Hadoop環(huán)境要求
附錄C 名詞解釋



本目錄推薦

掃描二維碼
Copyright ? 讀書網 www.dappsexplained.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號