前言
教學建議
第1章 緒論
1.1 引言
1.2 數據倉庫
1.2.1 從數據庫到數據倉庫
1.2.2 數據倉庫的基本概念
1.2.3 數據倉庫的體系結構
1.3 數據挖掘
1.3.1 KDD與數據挖掘
1.3.2 數據庫與數據挖掘發(fā)展歷程
1.3.3 數據挖掘的特征與對象
1.3.4 數據挖掘相關領域
1.4 數據倉庫與數據挖掘的關系
1.5 應用前景與發(fā)展趨勢
本章小結
習題
第2章 聯機分析處理
2.1 引言
2.2 OLAP的定義
2.3 OLAP的相關概念
2.4 OLAP與OLTP的關系和比較
2.5 OLAP準則
2.6 多維數據分析方法
2.7 關系數據的組織
2.8 多維數據的存儲方式
2.9 OLAP體系結構
2.10 OLAP的展現方式
2.11 OLAP工具的評價指標
2.12 OLAP的局限性
本章小結
習題
第3章 數據倉庫的設計與開發(fā)
3.1 引言
3.2 數據倉庫的數據模型概述
3.3 數據倉庫的分析與設計
3.3.1 需求分析
3.3.2 概念模型設計
3.3.3 邏輯模型設計
3.3.4 物理模型設計
3.3.5 數據倉庫的索引技術
3.4 數據倉庫的開發(fā)
3.4.1 風險因素
3.4.2 數據倉庫系統(tǒng)的生命周期
3.4.3 建立數據倉庫系統(tǒng)的思維模式
3.4.4 數據倉庫數據庫的設計步驟
3.4.5 數據質量與數據清洗
3.4.6 數據粒度與維度建模
3.4.7 選擇數據倉庫工具
3.4.8 提高數據倉庫性能
3.4.9 數據倉庫的安全性
3.5 主要的數據倉庫產品
本章小結
習題
第4章 關聯規(guī)則
4.1 引言
4.2 關聯規(guī)則模型
4.3 Apriori算法
4.3.1 發(fā)現頻繁項集
4.3.2 生成關聯規(guī)則
4.4 頻繁模式增長算法
4.4.1 建樹方法
4.4.2 用FP樹挖掘頻繁模式
4.5 關聯規(guī)則模型擴展
4.5.1 多級關聯規(guī)則
4.5.2 多維關聯規(guī)則
本章小結
習題
第5章 粗糙集
5.1 引言
5.2 近似空間
5.2.1 近似空間與不可分辨關系
5.2.2 知識與知識庫
5.3 近似與粗糙集
5.3.1 基本概念
5.3.2 基本性質
5.4 描述粗糙集的特征的方法
5.4.1 近似精度
5.4.2 拓撲特征
5.5 信息系統(tǒng)
5.5.1 信息系統(tǒng)的定義
5.5.2 約簡和核
5.5.3 分辨矩陣與分辨函數
5.5.4 信息系統(tǒng)約簡
5.6 決策表
5.6.1 相對約簡與知識依賴性
5.6.2 決策表及其約簡
5.6.3 近似約簡算法
5.6.4 決策規(guī)則
本章小結
習題
第6章 決策樹
6.1 引言
6.2 構建決策樹的理論問題
6.2.1 為當前結點選擇屬性
6.2.2 過擬合問題
6.3 ID3算法
6.3.1 生成決策樹的算法
6.3.2 生成規(guī)則和決策
6.4 決策樹的剪枝
6.4.1 預剪枝
6.4.2 后剪枝
6.5 C4.5算法
本章小結
習題
第7章 聚類分析
7.1 引言
7.2 聚類分析簡介
7.2.1 聚類分析
7.2.2 聚類分析應用領域與算法特征
7.3 數據類型、距離和相似系數
7.3.1 數據類型
7.3.2 距離和相似系數
7.4 聚類方法與聚類分類
7.4.1 聚類方法
7.4.2 聚類方法的分類
7.5 劃分方法
7.5.1 k-均值算法
7.5.2 k-中心點算法
7.5.3 關于參數K
7.5.4 EM聚類
7.6 層次方法
7.6.1 層次聚類中的距離度量
7.6.2 分裂方法
7.6.3 凝聚方法
7.7 基于密度的方法
7.7.1 DBSCAN算法
7.7.2 矢量感應聚類算法
7.8 聚類評估
7.8.1 假設檢驗
7.8.2 聚類評估中的假設檢驗
7.8.3 相對準則
本章小結
習題
第8章 興趣度量
8.1 引言
8.2 用于關聯規(guī)則和分類規(guī)則的度量
8.2.1 客觀度量
8.2.2 主觀度量
8.2.3 語義度量
8.3 用于總結的度量
8.4 分類器的興趣度
本章小結
習題
第9章 應用案例
9.1 數據倉庫應用案例
9.1.1 案例一:網絡購物數據倉庫
9.1.2 案例二:社會保障卡數據倉庫
9.1.3 案例三:醫(yī)院信息系統(tǒng)數據倉庫
9.2 數據挖掘應用案例
9.2.1 案例一:零售商系統(tǒng)貨籃數據挖掘
9.2.2 案例二:通信用戶滿意度指數評測
9.2.3 案例三:城市環(huán)境質量評價
本章小結
參考文獻