注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡(luò)計算機科學理論與基礎(chǔ)知識數(shù)據(jù)科學實戰(zhàn)

數(shù)據(jù)科學實戰(zhàn)

數(shù)據(jù)科學實戰(zhàn)

定 價:¥79.00

作 者: (美)舒特(Rachel Schutt),(美)奧尼爾(Cathy O''Neil)
出版社: 人民郵電出版社
叢編項:
標 簽: 計算機/網(wǎng)絡(luò) 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 數(shù)據(jù)庫

ISBN: 9787115383495 出版時間: 2015-03-01 包裝: 平裝
開本: 16開 頁數(shù): 290頁 字數(shù):  

內(nèi)容簡介

  本書脫胎于哥倫比亞大學“數(shù)據(jù)科學導論”課程的教學講義,它界定了數(shù)據(jù)科學的研究范疇,是一本注重人文精神,多角度、全方位、深入介紹數(shù)據(jù)科學的實用指南,堪稱大數(shù)據(jù)時代的實戰(zhàn)寶典。本書旨在讓讀者能夠舉一反三地解決重要問題,內(nèi)容包括:數(shù)據(jù)科學及工作流程、統(tǒng)計模型與機器學習算法、信息提取與統(tǒng)計變量創(chuàng)建、數(shù)據(jù)可視化與社交網(wǎng)絡(luò)、預(yù)測模型與因果分析、數(shù)據(jù)預(yù)處理與工程方法。另外,本書還將帶領(lǐng)讀者展望數(shù)據(jù)科學未來的發(fā)展。

作者簡介

  Rachel Schutt,美國新聞集團旗下數(shù)據(jù)科學部門高級副總裁、哥倫比亞大學統(tǒng)計系兼職教授、約翰遜實驗室高級研究科學家,同時也是哥倫比亞大學數(shù)據(jù)科學及工程研究所教育委員會的發(fā)起人之一。她曾在谷歌研究院工作數(shù)年,負責設(shè)計算法原型并通過建模理解用戶行為。Cathy O'Neil,約翰遜實驗室高級數(shù)據(jù)科學家、哈佛大學數(shù)學博士、麻省理工學院數(shù)學系博士后、巴納德學院教授,曾發(fā)表過大量算術(shù)代數(shù)幾何方面的論文。他曾在著名的全球投資管理公司D.E. Shaw擔任對沖基金金融師,后加入專門評估銀行和對沖基金風險的軟件公司RiskMetrics,個人博客:mathbabe.org。

圖書目錄

作者介紹
關(guān)于封面圖
前言
第1章簡介:什么是數(shù)據(jù)科學
 1.1大數(shù)據(jù)和數(shù)據(jù)科學的喧囂
 1.2沖出迷霧
 1.3為什么是現(xiàn)在
 1.4數(shù)據(jù)科學的現(xiàn)狀和歷史
 1.5數(shù)據(jù)科學的知識結(jié)構(gòu)
 1.6思維實驗:元定義
 1.7什么是數(shù)據(jù)科學家
  1.7.1學術(shù)界對數(shù)據(jù)科學家的定義
  1.7.2工業(yè)界對數(shù)據(jù)科學家的定義
第2章統(tǒng)計推斷、探索性數(shù)據(jù)分析和數(shù)據(jù)科學工作流程
 2.1大數(shù)據(jù)時代的統(tǒng)計學思考
  2.1.1統(tǒng)計推斷
  2.1.2總體和樣本
  2.1.3大數(shù)據(jù)的總體和樣本
  2.1.4大數(shù)據(jù)意味著大膽的假設(shè)
  2.1.5建模
 2.2探索性數(shù)據(jù)分析
  2.2.1探索性數(shù)據(jù)分析的哲學
  2.2.2練習:探索性數(shù)據(jù)分析
 2.3數(shù)據(jù)科學的工作流程
 2.4思維實驗:如何模擬混沌
 2.5案例學習:RealDirect
  2.5.1RealDirect是如何賺錢的
  2.5.2練一練:RealDirect公司的數(shù)據(jù)策略
第3章算法
 3.1機器學習算法
 3.2三大基本算法
  3.2.1線性回歸模型
  3.2.2足近鄰模型(k-NN)
  3.2.3I(均值算法
 3.3練習:機器學習算法基礎(chǔ)
 3.4總結(jié)
 3.5思維實驗:關(guān)于統(tǒng)計學家的自動化
第4章垃圾郵件過濾器、樸素貝葉斯與數(shù)據(jù)清理
 4.1思維實驗:從實例中學習
  4.1.1線性回歸為何不適用
  4.1.2l(近鄰效果如何
 4.2樸素貝葉斯模型
  4.2.1貝葉斯法則
  4.2.2個別單詞的過濾器
  4.2.3直通樸素貝葉斯
 4.3拉普拉斯平滑法
 4.4對比樸素貝葉斯和k近鄰
 4.5Bash代碼示例”
 4.6網(wǎng)頁抓取:APl和其他工具
 4.7Jake的練習題:文章分類問題中的樸素貝葉斯模型
第5章邏輯回歸
 5.1思維實驗
 5.2分類器
  5.2.1運行時間
  5.2.2你自己
  5.2.3模型的可解釋性
  5.2.4可擴展性
 ……
第6章時間戳數(shù)據(jù)與金融建模
第7章從數(shù)據(jù)到結(jié)論
第8章構(gòu)建面向大量用戶的推薦引擎
第9章數(shù)據(jù)可視化與欺詐偵測
第10章社交網(wǎng)絡(luò)與數(shù)據(jù)新聞學
第11章因果關(guān)系研究
第12章流行病學
第13章從競賽中學到的:數(shù)據(jù)泄漏和模型評價
第14章數(shù)據(jù)工程:Mapreduce pregel、Hadoop
第15章聽聽學生學們怎么說
第16章下一代數(shù)據(jù)科學家、自大狂和職業(yè)道德

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.dappsexplained.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號