注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡數(shù)據(jù)庫數(shù)據(jù)庫挖掘/數(shù)據(jù)倉庫數(shù)據(jù)挖掘?qū)嵺`:計算機科學叢書

數(shù)據(jù)挖掘?qū)嵺`:計算機科學叢書

數(shù)據(jù)挖掘?qū)嵺`:計算機科學叢書

定 價:¥39.00

作 者: (美)Olivia Parr Rud著;朱揚勇等譯;朱揚勇譯
出版社: 機械工業(yè)出版社
叢編項: 數(shù)據(jù)庫技術(shù)叢書
標 簽: 數(shù)據(jù)庫存儲與管理

ISBN: 9787111122210 出版時間: 2003-09-01 包裝: 膠版紙
開本: 26cm 頁數(shù): 314 字數(shù):  

內(nèi)容簡介

  OliviaParrRud是DataSquare,LLC的執(zhí)行副總裁。Olivia在金融服務行業(yè)已經(jīng)工作了二十多年,其中10年專門從事信用卡、保險、電信、零售、度假業(yè)、名錄服務行業(yè)的數(shù)據(jù)挖掘、建模和劃分工作。利用自己分析能力與創(chuàng)造才華,她提供客戶獲取、模型維護、風險、總盈利等方面的分析和解決方案。本書詳細介紹了一種新的數(shù)據(jù)挖掘技術(shù)—數(shù)據(jù)建模,并著重闡述整個模型開發(fā)過程的細節(jié)。本書包括三個部分。第一部分講述了基礎知識,內(nèi)容涉及確定目標和從商業(yè)預測中定義目標的重要性,并給出了收集數(shù)據(jù)和創(chuàng)建數(shù)據(jù)集的例子。第二部分通過一實例詳?shù)殛U述了模型開發(fā)的整個過程。第三部分通過應用于保險業(yè)、銀行、電信行業(yè)的實例詳細說明了不同目標的數(shù)據(jù)建模過程中的幾個關鍵步驟。本書將數(shù)據(jù)挖掘的技藝用飲食烹調(diào)的思?爰右在故?,易诱O斫?,遍斦V郵?。蕶┬给除_鬧詼嗍道浞痔逑至俗髡叨嗄甑男幸稻椋緣鼻暗氖諧∮涂突Ч叵倒芾斫>哂屑訓慕杓饔謾1臼槭屎暇哂幸歡ǖ耐臣坪頭治黿;〉畝琳咴畝粒勺魑治鍪?、数据驼a蛉嗽?、营销经理的工佐|植?,也可作为紦溷机相关专覚n謀究粕芯可灘幕蠆鉤潿廖鎩?"什么是數(shù)據(jù)挖掘數(shù)據(jù)挖掘(datamining)這個術(shù)語涵蓋了應用于各個行業(yè)的多種技術(shù)。由于市場份額和利潤競爭的日趨激烈,數(shù)據(jù)挖掘成為公司在客戶生命周期的各個階段維持競爭力的必要工具。過去,數(shù)據(jù)挖掘的形式之一也稱為數(shù)據(jù)捕撈(datadredging)。這種方法曾被認為沒有達到合格的研究標準。也就是說,研究人員實際上可能沒有作任何預定義的假設就開始研究所有的數(shù)據(jù)。然而,由于這種形式的數(shù)據(jù)挖掘確實可以發(fā)現(xiàn)有價值的信息,所以它開始被廣為接受。在美國的公司里,如果有一種方法可以發(fā)現(xiàn)如何提高利潤,那么人們會迅速地接受、信賴它。20世紀80年代末至90年代初,另一種形式的數(shù)據(jù)挖掘開始在營銷領域流行起來。幾個技術(shù)領先的信用卡銀行發(fā)現(xiàn),有一種新的稱為數(shù)據(jù)建模(datamodeling)的數(shù)據(jù)挖掘技術(shù)可以提高獲得客戶的能力,改進風險管理。大量的活動和空前的增長為數(shù)據(jù)建模的繁榮發(fā)展提供了肥沃的土壤。數(shù)據(jù)建模的成功和它所帶來的利潤為它在其他行業(yè)的應用鋪平了道路。目前,使用數(shù)據(jù)建模技術(shù)進行營銷的行業(yè)包括保險業(yè)、零售業(yè)、投資銀行、公共事業(yè)部門、電信業(yè)、能源業(yè)、度假業(yè)、游戲業(yè)和藥品行業(yè)等等。本書的重點許多統(tǒng)計理論的書都談到了數(shù)據(jù)建模技術(shù)。但本書并不是那樣的一本書!本書討論的重點是在營銷、風險和客戶關系管理(CRM)中使用這些技術(shù)所需的實踐知識。大部分公司都被數(shù)據(jù)挖掘軟件工具?鬧擲嗪凸δ芘醚芻ㄧ月?lián)uH砑潭忌撲塹娜砑恰耙子謔褂謾焙汀拔扌樅魏畏治黽寄堋鋇?。但薁楷晤U且言詒玖煊蜆ぷ鞫嗄輳勒廡┕愀媸遣蛔鬮諾摹H魏謂O钅康某曬Σ喚黿鋈【鲇詼雜詵椒ㄑУ牧己美斫?,还取决釉溤数臼n⑹諧「駝逕桃的勘甑睦斫狻J率瞪?,峨s謖齬潭裕P痛砉討皇瞧渲械囊恍〔糠幀?本書將著重闡述整個模型開發(fā)的過程。討論的內(nèi)容包括對商業(yè)或市場的預測,以及處理過程中所需的復雜的SAS代碼。這是為了強調(diào)實際模型處理過程之前與之后的步驟的重要性。本書的讀者隨著數(shù)據(jù)挖掘應用的飛速發(fā)展,對資深分析師和數(shù)據(jù)挖掘師的需求也增加了。但是,由于此類人才短缺,公司便雇用有才華的統(tǒng)計學家或初級分析師,他們懂技術(shù),但是缺乏必要的商業(yè)敏感性。公司也可能會購買復雜的數(shù)據(jù)挖掘軟件工具,這些工具所提供的解決方案對分析技術(shù)知識,或者與目標相關的業(yè)務知識都知之甚少。不管是哪種情況,都有可能缺乏某些領域的知識,如定義目標的結(jié)構(gòu),獲取和準備數(shù)據(jù),確認和應用模型以及測量結(jié)果等。任何一個領域的錯誤都可能是災難性的,會造成巨大的浪費。本書可作為不同級別的分析師、數(shù)據(jù)挖掘人員和營銷經(jīng)理的工作手冊。本書提供了數(shù)據(jù)建模的逐步指導,尤其強調(diào)了必要的商業(yè)知識,以得到有益的結(jié)果。對于那些數(shù)據(jù)挖掘的初學者,本書可作為整個過程的綜合指導。對于經(jīng)驗豐富的分析師而言,本書可以作為參考手冊。最后,對于管理人員而言,閱讀本書可以對成功運用數(shù)據(jù)模型所需的技術(shù)與過程有基本的了解。本書的結(jié)構(gòu)本書分為三個部分。第一部分講述基礎知識。第1章討論了確定目標和從商業(yè)角度定義目標的重要性。第2章討論并提供了大量的例子,其中包括收集數(shù)據(jù)和創(chuàng)建建模數(shù)據(jù)集。第二部分通過一個案例研究,詳細闡述了模型開發(fā)過程的每個步驟。第3章-第7章討論了數(shù)據(jù)清洗、變量歸約和轉(zhuǎn)換、模型處理、驗證、實施的步驟。第三部分提供一系列的案例研究,這些案例分別應用于保險業(yè)、銀行、電信等行業(yè),詳細說明了不同目標的數(shù)據(jù)建模過程的幾個關鍵步驟,包括特征、響應、風險和生命周期值。隨著本書對模型開發(fā)步驟的深入探討,作者加進了幾位業(yè)內(nèi)專家的合理建議,他們都是數(shù)據(jù)挖掘領域的先鋒。這些建議對某個主題提出了不同看法,如多重共線性,建立生命周期值模型的其他方法等。所需工具要使用本書提供解決方案,讀者要對統(tǒng)計學有基本的了解。如果你的目標是要得到管理層數(shù)據(jù)建模的使用建議,則需要進行準確的商業(yè)判斷。本書所有的代碼示例都是用SAS寫的,為了在SAS上實現(xiàn)這些代碼,用戶需要BaseSAS和SAS/STAT。電子數(shù)據(jù)表都是用微軟的Excel做成的。但是,基本的邏輯和指令對所有的軟件包和建模工具都是有效的。配套光盤本書從第3章—第13章都包含了開發(fā)、驗證和實施數(shù)據(jù)模型的SAS代碼。對這些代碼稍做修改,再加上一些常識,就能夠從數(shù)據(jù)準備階段到模型的開發(fā)與驗證階段建立一個模型。但是,這樣需要大量的時間,還有可能出現(xiàn)編碼錯誤。為了簡化這項工作并使代碼更容易地用于不同的數(shù)據(jù)模型,原出版社出版了配套光盤,但需要讀者另行購買。光盤里包括了開發(fā)不同模型所需的全部代碼,模型包括:響應、驗證、流失、風險、生命周期值或凈現(xiàn)值。開發(fā)目標函數(shù)的具體代碼包括信用卡、保險、電信、名錄服務的例子。代碼中有清楚的注釋,解釋了每一個步驟的目的與方法,所需要的軟件是BaseSAS和SAS/STAT。用于創(chuàng)建收益表和增幅圖的電子數(shù)據(jù)表也包含在光盤中。通過SAS創(chuàng)建的初步分析結(jié)果可以得到這些表并加以使用。既然模型處理前后的步驟可以結(jié)合任何數(shù)據(jù)模型軟件包來使用,代碼自然也可以作為獨立的建模模板。模型處理步驟重點在于邏輯遞歸上的數(shù)據(jù)準備。光盤上還包括用于變量驗證和處理的SAS宏。本書沒有涵蓋的內(nèi)容一本數(shù)據(jù)挖掘的書如果沒有提到隱私權(quán),那么就不能算是完整。我相信這是數(shù)據(jù)挖掘工作者的一項重要的工作。關于這個話題,可以再寫一本書。所以,本書中沒有談到這一點。但是,我希望所有使用個人數(shù)據(jù)進行營銷的公司都能制訂一項隱私權(quán)的法規(guī)。要獲得更進一步的信息和指導,請與DirectMarketingAssociation聯(lián)系,電話(212)790-1500,或者訪問他們的網(wǎng)站http://www.the-dma.org。小結(jié)有效的數(shù)據(jù)挖掘是科學與藝術(shù)的復雜混合體。數(shù)據(jù)挖掘工具的數(shù)量每年都在增長。研究人員不斷開發(fā)新方法,軟件廠商實現(xiàn)現(xiàn)有的方法,才華橫溢的分析師則利用標準技術(shù)來推進過程。數(shù)據(jù)挖掘(說得具體一點,數(shù)據(jù)建模)已經(jīng)成為公司維持利潤的戰(zhàn)略必備工具。希望本書可以成為你實現(xiàn)數(shù)據(jù)挖掘目標時方便的參考和恰當?shù)南驅(qū)А?quot;

作者簡介

  OliviaParrRud是DataSquare,LLC的執(zhí)行副總裁。Olivia在金融服務行業(yè)已經(jīng)工作了二十多年,其中10年專門從事信用卡、保險、電信、零售、度假業(yè)、名錄服務行業(yè)的數(shù)據(jù)挖掘、建模和劃分工作。利用自己分析能力與創(chuàng)造才華,她提供客戶獲取、模型維護、風險、總盈利等方面的分析和解決方案。

圖書目錄

譯者序
對本書的贊譽

前言
作者介紹
第一部分 計劃菜單
第1章 設立目標
1.1 定義目標
1.1.1 特征分析
1.1.2 劃分
1.1.3 響應
1.1.4 風險
1.1.5 激活
1.1.6 交叉銷售和提升銷售
1.1.7 流失
1.1.8 凈現(xiàn)值
1.1.9 生命周期價值
1.2 選擇建模方法
1.2.1 線性回歸
1.2.2 邏輯回歸
1.2.3 神經(jīng)網(wǎng)絡
1.2.4 遺傳算法
1.2.5 分類樹
1.3 自適應公司
1.3.1 雇傭和合作
1.3.2 以產(chǎn)品為中心與以客戶為中心
1.4 小結(jié)
第2章 選擇數(shù)據(jù)源
2.1 數(shù)據(jù)類型
2.1.1 人口統(tǒng)計學數(shù)據(jù)一般描述個人或家庭特征
2.1.2 行為數(shù)據(jù)是行動或行為的一種度量
2.1.3 心理或態(tài)度數(shù)據(jù)以觀點、生活方式
2.2 數(shù)據(jù)源
2.2.1 內(nèi)部數(shù)據(jù)源
2.2.2 外部數(shù)據(jù)源
2.3 選擇建模數(shù)據(jù)
2.3.1 潛在客戶數(shù)據(jù)
2.3.2 客戶模型數(shù)據(jù)
2.3.3 風險模型數(shù)據(jù)
2.4 構(gòu)造建模數(shù)據(jù)集
2.4.1 如何確定樣本尺寸
2.4.2 采樣方法
2.4.3 根據(jù)已建立模型的數(shù)據(jù)開發(fā)模型
2.4.4 集成多個宣傳活動的數(shù)據(jù)
2.5 小結(jié)
第二部分 烹調(diào)演示
第3章 準備數(shù)據(jù)
3.1 訪問數(shù)據(jù)
3.1.1 數(shù)據(jù)分類
3.1.2 讀原始數(shù)據(jù)
3.2 創(chuàng)建建模數(shù)據(jù)集
3.3 清理數(shù)據(jù)
3.3.1 連續(xù)變量
3.3.2 類型變量
3.4 小結(jié)
第4章 選擇及轉(zhuǎn)換變量
4.1 定義目標函數(shù)
4.1.1 激活概率
4.1.2 風險指數(shù)
4.1.3 產(chǎn)品收益率
4.1.4 營銷費用
4.2 派生變量
4.2.1 概化
4.2.2 比率
4.2.3 日期
4.3 變量歸約
4.3.1 連續(xù)變量
4.3.2 類別變量
4.4 開發(fā)線性預測因子
4.4.1 連續(xù)變量
4.4.2 類別變量
4.5 相互作用檢測
4.6 小結(jié)
第5章 處理和評價模型
5.1 處理模型
5.1.1 分割數(shù)據(jù)
5.1.2 方法1:單模型
5.1.3 方法2:雙模型——響應
5.1.4 方法2:雙模型——激活
5.1.5 方法1與方法2的比較
5.2 小結(jié)
第6章 驗證模型
6.1 收益表與收益圖
6.1.1 方法1:單模型
6.1.2 方法2:雙模型
6.2 為備用數(shù)據(jù)集評分
6.3 重新采樣
6.3.1 折疊
6.3.2 自引導
6.4 關鍵變量的十分位數(shù)分析
6.5 小結(jié)
第7章 實施與維護模型
7.1 為新文件評分
7.1.1 內(nèi)部評分
7.1.2 外部評分與審計
7.2 實施模型
7.2.1 計算機財務狀況
7.2.2 決定文件分割點
7.2.3 衛(wèi)冕者與挑戰(zhàn)者
7.2.4 雙模型矩陣
7.3 模型跟蹤
7.4 模型維護
7.4.1 模型壽命
7.4.2 模型記錄
7.5 小結(jié)
第三部分 每個節(jié)日的菜肴配方
第8章 了解你的客戶:特征化和劃分
8.1 為什么了解客戶很重要
8.2 目錄服務公司客戶的特征化昨滲透分析
8.2.1 RFM分析
8.2.2 滲透分析
8.3 為信用卡公司開發(fā)客戶價值矩陣
8.4 執(zhí)行聚類分析以發(fā)現(xiàn)客戶劃分
8.5 小結(jié)
第9章 定位新的潛在客戶:響應建模
9.1 定義目標
9.2 準備變更
9.2.1 連續(xù)變量
9.2.2 類別變量
9.3 處理模型
9.4 用自引導驗證
9.5 實現(xiàn)模型
9.6 小結(jié)
第10章 避免高風險客戶:風險建模
10.1 信用評分和風險建模
10.2 定義目標
10.3 準備變量
10.4 處理模型
10.5 驗證模型
10.6 實現(xiàn)模型
10.7 另一種風險:欺詐
10.8 小結(jié)
第11章 留信創(chuàng)利客戶:流失建模
11.1 客戶忠誠度
11.2 定義目標
11.3 準備變量
11.3.1 連續(xù)變量
11.3.2 類型變量
11.4 處理模型
11.5 驗證模型
11.6 實現(xiàn)模型
11.6.1 建立流失客戶特征
11.6.2 優(yōu)化客戶創(chuàng)利能力
11.6.3 提前保留客戶
11.7 小結(jié)
第12章 定位創(chuàng)利客戶:生命周期價值建模
12.1 什么是生命周期價值
12.1.1 使用生命周期價值
12.1.2 生命周期價值的組成
12.2 生命周期價值的應用
12.3 為可續(xù)約產(chǎn)品或服務計算生命周期價值
12.4 計算機生命周期價值:案例研究
12.4.1 案例研究:第一年凈收入
12.4.2 生命周期價值計算
12.5 小結(jié)
第13章 快餐:Web建模
13.1 Web挖掘和Web建模
13.1.1 定義目標
13.1.2 Web數(shù)據(jù)源
13.1.3 準備Web數(shù)據(jù)
13.1.4 選擇方法學
13.2 在Web上建立品牌
13.3 實時洞察客戶
13.4 Web使用挖掘——案例分析
13.5 小結(jié)
附錄A 連續(xù)變量的單變量分析
附錄B 類別變量的單變量分析
附錄C 推薦閱讀教材

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.dappsexplained.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號