第1章 XML查詢處理技術 1.1 XML文檔標準 1.1.1 XML簡介 1.1.2 DTD 1.1.3 XSD 1.2 XML文檔模型 1.2.1 對象交換模型(OEM) 1.2.2 文檔對象模型(DOM) 1.3 完全結構下的XML查詢技術 1.3.1 FS查詢模型 1.3.2 XPath 1.3.3 XQuery 1.3.4 FS模型比較 1.4 基于編碼的XMI。查詢技術 1.4.1 XML編碼技術 1.4.2 基于編碼的結構連接方法 1.5 基于結構索引的XML查詢技術第2章 非完全結構下的XMI.查詢概述 2.1 背景與動機 2.2 NFS查詢關鍵技術 2.3 XML檢索查詢模型 2.3.1 基于關鍵字的查詢模型 2.3.2 基于標簽和關鍵字的查詢模型 2.4 FS查詢擴展 2.5 NFS查詢模型第3章 有意義的NFS查詢結果 3.1 一致文檔片段 3.2 Interconnection關系 3.3 有意義的最近公共祖先 3.4 最小全部目標對象網(MTTON) 3.5 PE模型 3.5.1 討論 3.5.2 相關概念 3.5.3 PE模式和實體 3.5.4 PE規(guī)則 3.5.5 等價模式和等價查詢項 3.5.6 比較分析 3.6 GPE模型 3.6.1 概念與定義 3.6.2 GPE模式與實體 3.6.3 GPE規(guī)則 3.6.4 GPE等價模式 3.6.5 性能分析第4章 NFS查詢處理關鍵技術 4.1 Interconnection關系計算 4.2 MLCAS計算 4.2.1 Timber 4.2.2 基于圖的MLCA求解方法 4.3 PE模型計算 4.3.1 XML編碼 4.3.2 PE索引 4.3.3 12P倒排索引 4.3.4 判別方法 4.3.5 算法設計 4.3.6 比較分析 4.4 L(k)-index 4.4.1 基于k雙擬的結構索引 4.4.2 基本概念與定義 4.4.3 L(k)-index索引結構 4.4.4 查詢處理 4.4.5 L(k)-index創(chuàng)建與更新 4.4.6 性能分析第5章 NFS查詢結果聚類 5.1 引言 5.2 文檔特征降維技術 5.2.1 特征選取技術 5.2.2 基于概念的降維技術 5.3 基于傳統(tǒng)聚類技術的文檔聚類方法 5.3.1 基于相似性的聚類方法 5.3.2 基于模型的聚類方法 5.3.3 基于劃分的聚類方法 5.3.4 基于層次的聚類方法 5.4 面向文檔特性的聚類方法 5.4.1 潛在語義分析 5.4.2 基于信息論的文檔聚類方法 5.4.3 雙向聚類方法 5.5 聚類質量評價方法第6章 基于模型的非偏斜文檔聚類方法 6.1 引言 6.2 相關工作 6.2.1 基于多項式分布的硬聚類 6.2.2 基于平衡約束的聚類方法 6.3 聚類偏斜的分析 6.3.1 相關概念與定義 6.3.2 聚類偏斜產生的原因 6.4 MMPClust聚類方法 6.4.1 基于內容特性的簇模型 6.4.2 估計樣本選取 6.4.3 MMPClust算法 6.5 實驗分析 6.5.1 數據集 6.5.2 實驗方法與評價方法 6.5.3 實驗結果與分析 6.6 小結第7章 基于信息論的潛在概念獲取與文檔聚類方法 7.1 相關工作 7.2 模型提出 7.2.1 詞、潛在概念、文檔和主題的關系 7.2.2 模型描述 7.3 模型求解 7.3.1 給定β下目標函數求解 7.3.2 潛在概念個數確定 7.3.3 算法設計 7.4 實驗分析 7.4.1 數據集和實驗方法 7.4.2 性能分析 7.5 小結參考文獻