注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)挖掘/數(shù)據(jù)倉(cāng)庫(kù)社交網(wǎng)站的數(shù)據(jù)挖掘與分析

社交網(wǎng)站的數(shù)據(jù)挖掘與分析

社交網(wǎng)站的數(shù)據(jù)挖掘與分析

定 價(jià):¥59.00

作 者: (美)羅塞爾 著,師蓉 譯
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787111369608 出版時(shí)間: 2012-02-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 301 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  Facebook、Twitter和LinkedIn產(chǎn)生了大量寶貴的社交數(shù)據(jù),但是怎樣才能找出誰(shuí)通過(guò)社交媒介正在進(jìn)行聯(lián)系?他們?cè)谟懻撔┦裁??或者他們?cè)谀膬??本?shū)簡(jiǎn)潔而且具有可操作性,它將揭示如何回答這些問(wèn)題甚至更多的問(wèn)題。你將學(xué)到如何組合社交網(wǎng)絡(luò)數(shù)據(jù)、分析技術(shù),如何通過(guò)可視化幫助你找到你一直在社交世界中尋找的內(nèi)容,以及你聞所未聞的有用信息。本書(shū)每章都介紹了在社交網(wǎng)絡(luò)的不同領(lǐng)域挖掘數(shù)據(jù)的技術(shù),這些領(lǐng)域包括博客和電子郵件。你所需要具備的就是一定的編程經(jīng)驗(yàn)和學(xué)習(xí)基本的Python工具的意愿。通過(guò)本書(shū),你將 . 獲得對(duì)社交網(wǎng)絡(luò)世界的直觀認(rèn)識(shí) .使用GitHub上靈活的腳本來(lái)獲取從諸如Twitter、Facebook和LinkedIn等社交網(wǎng)絡(luò)API中的數(shù)據(jù) . 學(xué)習(xí)如何應(yīng)用便捷的Python工具來(lái)交叉分析你所收集的數(shù)據(jù) . 通過(guò)XFN探討基于微格式的社交聯(lián)系 . 應(yīng)用諸如TF-IDF、余弦相似性、搭配分析、文檔摘要、派系檢測(cè)之類(lèi)的先進(jìn)挖掘技術(shù) . 通過(guò)基于HTML 5和JavaScript工具包的網(wǎng)絡(luò)技術(shù)建立交互式可視化

作者簡(jiǎn)介

  馬修·羅塞爾(Matthew A.Russell),Digital ReasoningSystems公司的技術(shù)副總裁和Zaffra公司的負(fù)責(zé)人,是熱愛(ài)數(shù)據(jù)挖掘、開(kāi)源和Web應(yīng)用技術(shù)的計(jì)算機(jī)科學(xué)家。他也是《Dojo:The DofinitiveGuide》(O'Reilly出版社)的作者。在LinkedIn上聯(lián)系他或在Twitter上關(guān)注@ptwobrussell,可隨時(shí)關(guān)注他的最新動(dòng)態(tài)。

圖書(shū)目錄

前言
第1章 緒論:Twitter 數(shù)據(jù)的處理
Python 開(kāi)發(fā)工具的安裝
Twitter 數(shù)據(jù)的收集和處理
小結(jié)
第2章 微格式:語(yǔ)義標(biāo)記和常識(shí)碰撞
XFN 和朋友
使用XFN 來(lái)探討社交關(guān)系
地理坐標(biāo):興趣愛(ài)好的共同主線
(以健康的名義)對(duì)菜譜進(jìn)行交叉分析
對(duì)餐廳評(píng)論的搜集
小結(jié)
第3章 郵箱:雖然老套卻很好用
mbox:Unix 的入門(mén)級(jí)郵箱
mbox+CouchDB= 隨意的Email 分析
將對(duì)話(huà)線程化到一起
使用SIMILE Timeline 將郵件“事件”可視化
分析你自己的郵件數(shù)據(jù)
小結(jié)
第4章 Twitter :朋友、關(guān)注者和Setwise 操作
REST 風(fēng)格的和OAuth-Cladded API
干練而中肯的數(shù)據(jù)采集器
友誼圖的構(gòu)建
小結(jié)
第5章 Twitter:tweet ,所有的tweet ,只有tweet
筆PK 劍:和tweet PK 機(jī)槍
對(duì)tweet 的分析(每次一個(gè)實(shí)體)
并置潛在的社交網(wǎng)站(或#JustinBieber VS #TeaParty)
對(duì)大量tweet 的可視化
小結(jié)
第6章 LinkedIn :為了樂(lè)趣(和利潤(rùn)?)將職業(yè)網(wǎng)絡(luò)聚類(lèi)
聚類(lèi)的動(dòng)機(jī)
按職位將聯(lián)系人聚類(lèi)
獲取補(bǔ)充個(gè)人信息
從地理上聚類(lèi)網(wǎng)絡(luò)
小結(jié)
第7章 Google Buzz:TF-IDF 、余弦相似性和搭配194
Buzz=Twitter+ 博客
使用NLTK 處理數(shù)據(jù)
文本挖掘的基本原則
查找相似文檔
在二元語(yǔ)法中發(fā)Buzz
利用Gmail
在中斷之前試著創(chuàng)建一個(gè)搜索引擎……
小結(jié)
第8章 博客及其他:自然語(yǔ)言處理(等)
NLP :帕累托式介紹
使用NLTK 的典型NLP 管線
使用NLTK 檢測(cè)博客中的句子
對(duì)文件的總結(jié)
以實(shí)體為中心的分析:對(duì)數(shù)據(jù)的深層了解
小結(jié)256
第9章 Facebook :一體化的奇跡
利用社交網(wǎng)絡(luò)數(shù)據(jù)
對(duì)Facebook 數(shù)據(jù)的可視化
小結(jié)
第10章 語(yǔ)義網(wǎng):簡(jiǎn)短的討論
發(fā)展中的變革
人不可能只靠事實(shí)生活
期望

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) www.dappsexplained.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)