注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡(luò)數(shù)據(jù)庫全棧數(shù)據(jù)工程原理與實踐

全棧數(shù)據(jù)工程原理與實踐

全棧數(shù)據(jù)工程原理與實踐

定 價:¥43.00

作 者: 徐爾,趙魯濤 著
出版社: 機械工業(yè)出版社
叢編項: 普通高等教育人工智能與大數(shù)據(jù)系列教材
標 簽: 暫缺

購買這本書可以去


ISBN: 9787111650683 出版時間: 2020-05-01 包裝: 平裝
開本: 16開 頁數(shù): 250 字數(shù):  

內(nèi)容簡介

  本書由數(shù)據(jù)科學一線教學科研工作者、企業(yè)從業(yè)者根據(jù)自己日常的科研內(nèi)容和工作經(jīng)驗總結(jié)而成,對數(shù)據(jù)獲取、數(shù)據(jù)存儲、數(shù)據(jù)分析、數(shù)據(jù)展示等主要數(shù)據(jù)科學的典型步驟進行了細致的知識梳理,對當前科研和企業(yè)應用的前沿技術(shù)以清晰的脈絡(luò)和通俗易懂的語言進行了詳盡的講解。本書主要介紹了多種編程語言下的數(shù)據(jù)采集方式,多個形態(tài)的數(shù)據(jù)庫使用和適用場景,并穿插介紹了經(jīng)典的機器學習與深度學習方法,使讀者對數(shù)據(jù)科學的全棧技術(shù)有一定的了解和認知。本書代碼主要是在Python的基礎(chǔ)上開發(fā)的,結(jié)合成熟的機器學習框架Scikit-Learn,簡單易用的深度學習框架Keras,以存儲在MySQL、MongoDB、Redis、Neo4j等數(shù)據(jù)庫內(nèi)的多模態(tài)數(shù)據(jù)為樣例,為讀者直觀生動地展示全棧數(shù)據(jù)技術(shù)的整體過程,同時提供實踐課題和主要代碼,供學有余力的讀者進行綜合實訓。本書主要面向?qū)?shù)據(jù)科學、人工智能、機器學習、深度學習具有濃厚興趣且希望盡快入門的讀者、高校相關(guān)專業(yè)的教育工作者和在校學生,以及正在從事數(shù)據(jù)科學相關(guān)工作并且希望深入研究的數(shù)據(jù)科學家、軟件工程師、大數(shù)據(jù)平臺工程師和項目管理者等。

作者簡介

暫缺《全棧數(shù)據(jù)工程原理與實踐》作者簡介

圖書目錄

前 言
第 1章 數(shù)據(jù)獲取1
11
 HTTP 1
111HTTP簡介 1 112 
112一次網(wǎng)頁請求分析 1
12
 Chrome瀏覽器 2
121
 Chrome的特點 2
122
 Chrome配置 3 123 
基本功能介紹 3 124 
插件推薦 5
13
 HTML、CSS和 JavaScript 5
131
 HTML 6
132CSS 8
133 JavaScript 9

14Python爬蟲 10
141 Bs4和 Requests庫爬取 10
142PyQuery爬取 11
143Scrapy爬取 12
144Selenium自動化爬取 13
15JavaScript爬蟲 13
151 Node基礎(chǔ) 13
152 puppeteer爬蟲實戰(zhàn) 20
第 2章 數(shù)據(jù)存儲 22
21 數(shù)據(jù)庫介紹 22
211 數(shù)據(jù)庫發(fā)展 22
212 數(shù)據(jù)庫分類 23
213 常用關(guān)系型數(shù)據(jù)庫產(chǎn)品介紹 24
22關(guān)系型數(shù)據(jù)庫 MySQL 26
221 MySQL的配置 26
222 MySQL實踐 29

223 Python操作 MySQL 30

23
 文檔數(shù)據(jù)庫 MongoDB 35
231 MongoDB的配置 35
232 MongoDB實踐 37

233 Python操作 MongoDB 38

24Key-Value數(shù)據(jù)庫 Redis 39
241 Redis的配置 39
242 Redis操作 39

25 圖數(shù)據(jù)庫 Neo4j 41
251 Neo4j安裝 41
252 Neo4j語法 42
253 Neo4j命令 43
26 數(shù)據(jù)庫總結(jié) 44
第 3章 數(shù)據(jù)分析 45
31 數(shù)據(jù)分析簡介 45
311 數(shù)據(jù)分析的背景 46
312 數(shù)據(jù)分析的流程 47
32 數(shù)據(jù)分析工具 49
321 Numpy 49
322 Scipy 50
323 Matplotlib 50
324 Pandas 52
325 Scikit-Learn 53
326 Keras 54
33 數(shù)據(jù)探索 55
331 數(shù)據(jù)質(zhì)量分析 55
332 數(shù)據(jù)特征分析 57
333 Python工具分析 64
34 數(shù)據(jù)預處理 74
341 數(shù)據(jù)清洗 74
342 數(shù)據(jù)提取 76
343 數(shù)據(jù)變換 83
35 數(shù)據(jù)模型及評估 88
351 評估算法 88
352 評估矩陣 91
353 分類算法模型及評估 98
354 回歸算法模型及評估 103
第 4章 數(shù)據(jù)展示108
41 數(shù)據(jù)可視化簡介 108
42 可視化工具介紹 109
421 百度 ECharts 109
422 螞蟻金服 AntV 110
423 微軟 Power BI 111
424 Tableau 112
425 talkingData inMap 114
第 5章 社交網(wǎng)絡(luò)分析115
51 社交網(wǎng)絡(luò)分析應用介紹 115
511 社交網(wǎng)絡(luò)算法應用場景 115
512 社交網(wǎng)絡(luò)算法分析指標 116
513 社區(qū)發(fā)現(xiàn)簡介 116
514 社區(qū)發(fā)現(xiàn)算法 118
515 PageRank算法 119
52 Python社交網(wǎng)絡(luò)庫分析介紹 121
53 Cypher語言 121
531 Cypher簡介 121
532 Cypher語法入門 122
54 Neo4j高性能插件 APOC 129
第 6章 深度學習130
61 神經(jīng)網(wǎng)絡(luò)介紹 130
611 起源 130
612 優(yōu)化器 132
613 BP神經(jīng)網(wǎng)絡(luò) 137
62 CNN介紹 138
621 CNN網(wǎng)絡(luò)結(jié)構(gòu) 138
622 CNN類型 142
623 貓狗大戰(zhàn) 144
63 RNN介紹 147
631 RNN網(wǎng)絡(luò)結(jié)構(gòu) 148
632 LSTM網(wǎng)絡(luò)結(jié)構(gòu) 149
633 古詩自動生成 152
64 GAN模型 158
641 模型結(jié)構(gòu) 158
642 GAN模型拓展 160
643 卡通人臉自動生成 160
65 人臉識別庫 Dlib實戰(zhàn) 166
651 人臉識別發(fā)展 166
652 Dlib庫介紹 167
653 人臉識別實戰(zhàn) 167
第 7章 自然語言處理169
71 自然語言處理概述 169
72 自然語言處理常用工具 170
721 綜合處理類工具 171
722 中文類工具 171
73 文本預處理 172
731 分詞 172
732 停用詞處理 175
733 詞頻分析與探索 176
74 文本表示 178
741 詞袋模型 178
742 詞嵌入 180
75 文本分類 182
751 基于傳統(tǒng)機器學習的文本分類 183
752 基于深度學習的文本分類 185
第 8章 綜合實訓189
81 實訓 1:爬取網(wǎng)站實例 189
811 分析網(wǎng)站 189
812 元素定位 190
813 編寫代碼 191
814 部署 195
82 實訓 2:數(shù)據(jù)分析實戰(zhàn) 195
821 分類模型實戰(zhàn) 195
822 回歸模型實戰(zhàn) 208
83 實訓 3:實戰(zhàn)可視化 223
831 案例 1:ECharts 223
832 案例 2:AntV 224
84 實訓 4:《權(quán)力的游戲》關(guān)系圖譜解讀 226
841 基于圖分析 Neo4j 226
842 基于 Python-IGraph 233
843 使用 Py2neo 237
85 實訓 5:商品評價文本分類 239
851 建模之前 239
852 開始建模 240
853 代碼開發(fā)階段 241
854 分析、診斷與修正 248
855 總結(jié)與反思 249
參考文獻 250

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.dappsexplained.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號