注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)網(wǎng)絡(luò)與數(shù)據(jù)通信網(wǎng)絡(luò)服務(wù)大數(shù)據(jù)挖掘技術(shù)與應(yīng)用

大數(shù)據(jù)挖掘技術(shù)與應(yīng)用

大數(shù)據(jù)挖掘技術(shù)與應(yīng)用

定 價(jià):¥58.00

作 者: 周中元
出版社: 電子工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787121367731 出版時(shí)間: 2019-12-01 包裝:
開本: 16開 頁數(shù): 216 字?jǐn)?shù):  

內(nèi)容簡介

  本書系統(tǒng)介紹大數(shù)據(jù)技術(shù)的原理、數(shù)據(jù)挖掘與應(yīng)用,主要內(nèi)容包括基本概念、數(shù)據(jù)收集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理、大數(shù)據(jù)可視化、信息檢索、數(shù)據(jù)挖掘和效能評估。本書以簡單易懂的語言、生動(dòng)有趣的實(shí)例和圖形展示知識(shí)點(diǎn),將概念、原理與應(yīng)用融會(huì)貫通,并對大數(shù)據(jù)工具軟件進(jìn)行了細(xì)致的梳理。

作者簡介

  周中元,中國電科集團(tuán)公司第二十八研究所研究員,長期從事數(shù)據(jù)挖掘、大數(shù)據(jù)技術(shù)研究等工作,具有豐富的科研實(shí)踐經(jīng)驗(yàn)。

圖書目錄

第1章 大數(shù)據(jù)概述
1.1 從AlphaGo說起
1.2 大數(shù)據(jù)定義
1.3 大數(shù)據(jù)產(chǎn)生的原因
1.4 大數(shù)據(jù)發(fā)展歷程
1.5 大數(shù)據(jù)的特征
1.6 數(shù)據(jù)的度量
1.7 大數(shù)據(jù)思維
1.8 科學(xué)研究范式的發(fā)展
1.9 大數(shù)據(jù)的影響及應(yīng)用
1.10 大數(shù)據(jù)計(jì)算模式及產(chǎn)品
第2章 數(shù)據(jù)收集
2.1 外部數(shù)據(jù)收集
2.1.1 網(wǎng)絡(luò)爬蟲原理
2.1.2 搜索排序策略
2.1.3 Web網(wǎng)絡(luò)圖
2.1.4 構(gòu)建爬蟲系統(tǒng)
2.2 內(nèi)部數(shù)據(jù)收集
2.2.1 Flume
2.2.2 Chukwa
第3章 數(shù)據(jù)存儲(chǔ)
3.1 文件存儲(chǔ)
3.1.1 Hadoop簡介
3.1.2 文件存儲(chǔ)
3.1.3 HDFS的基本術(shù)語
3.1.4 HDFS運(yùn)行架構(gòu)
3.1.5 HDFS安全設(shè)計(jì)
3.1.6 HDFS的弱點(diǎn)
3.2 數(shù)據(jù)庫存儲(chǔ)
3.2.1 NoSQL簡介
3.2.2 列族數(shù)據(jù)庫HBase
3.2.3 文檔數(shù)據(jù)庫MongoDB
3.2.4 圖數(shù)據(jù)庫
3.2.5 鍵-值對數(shù)據(jù)庫
第4章 數(shù)據(jù)處理
4.1 離線批處理框架
4.2 MapReduce計(jì)算框架
4.3 Hadoop簡介
4.3.1 Hadoop生態(tài)圈
4.3.2 Hadoop發(fā)展歷程
4.3.3 Hadoop的特性
4.3.4 Hadoop的版本
4.4 HDFS高可用性架構(gòu)
4.5 HDFS聯(lián)邦
4.6 YARN
4.7 Hadoop工具集
4.8 消息機(jī)制
4.8.1 消息處理模型
4.8.2 JMS
4.9 內(nèi)存計(jì)算框架Spark
4.9.1 Spark的配置方式
4.9.2 Spark的主要特點(diǎn)
4.9.3 Spark生態(tài)圈
4.9.4 Spark與Hadoop比較
4.9.5 Spark運(yùn)行架構(gòu)
4.9.6 Spark基本運(yùn)行流程
4.9.7 RDD
4.10 流式計(jì)算框架
4.10.1 流式計(jì)算處理過程
4.10.2 常見的流式計(jì)算軟件
4.10.3 Storm系統(tǒng)
4.10.4 Spark Streaming
4.10.5 流計(jì)算與批處理計(jì)算的區(qū)別
4.11 圖計(jì)算
4.11.1 Pregel圖計(jì)算框架的提出
4.11.2 超步
4.11.3 Pregel計(jì)算模型
4.11.4 Pregel的C++ API
4.11.5 Pregel體系結(jié)構(gòu)
4.11.6 容錯(cuò)性
第5章 大數(shù)據(jù)可視化
5.1 數(shù)據(jù)可視化定義
5.2 數(shù)據(jù)可視化發(fā)展歷程
5.3 數(shù)據(jù)可視化的作用
5.4 數(shù)據(jù)可視化設(shè)計(jì)步驟
5.5 數(shù)據(jù)可視化設(shè)計(jì)要素
5.6 顏色可視化設(shè)計(jì)
5.6.1 色彩空間
5.6.2 色彩三要素
5.7 數(shù)據(jù)可視化基本圖形選用
5.8 數(shù)據(jù)可視化工具
第6章 信息檢索
6.1 信息檢索定義
6.2 相關(guān)性
6.2.1 布爾模型
6.2.2 排序布爾模型
6.2.3 向量空間模型
6.2.4 語言模型
6.3 及時(shí)性
6.4 搜索引擎
6.4.1 網(wǎng)頁鏈接分析法
6.4.2 電子商務(wù)中的商品排序
6.4.3 開源搜索引擎
6.5 推薦系統(tǒng)
6.5.1 何謂推薦系統(tǒng)
6.5.2 推薦系統(tǒng)與電商
6.5.3 推薦系統(tǒng)數(shù)據(jù)基礎(chǔ)
6.5.4 推薦方法
6.5.5 開源推薦系統(tǒng)
6.6 互聯(lián)網(wǎng)廣告
第7章 數(shù)據(jù)挖掘
7.1 基本概念
7.1.1 數(shù)據(jù)挖掘的定義
7.1.2 相關(guān)技術(shù)
7.2 數(shù)據(jù)來源
7.3 數(shù)據(jù)表示與預(yù)處理
7.4 機(jī)器學(xué)習(xí)算法
7.4.1 關(guān)聯(lián)分析
7.4.2 分類
7.4.3 回歸分析算法
7.4.4 聚類分析
7.5 數(shù)據(jù)挖掘工具軟件
第8章 效能評估
8.1 效果評估
8.1.1 對信息檢索的評估
8.1.2 對分類的評估
8.1.3 對聚類的評估
8.2 性能評估
附錄 Hadoop編年史
參考文獻(xiàn)

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.dappsexplained.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)