注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)信息系統(tǒng)智能信息處理:漢語語料庫加工技術(shù)及應(yīng)用

智能信息處理:漢語語料庫加工技術(shù)及應(yīng)用

智能信息處理:漢語語料庫加工技術(shù)及應(yīng)用

定 價:¥60.00

作 者: 鄭家恒 等著
出版社: 科學(xué)出版社
叢編項:
標(biāo) 簽: 計算機理論

ISBN: 9787030291356 出版時間: 2010-10-01 包裝: 平裝
開本: 16開 頁數(shù): 318 字?jǐn)?shù):  

內(nèi)容簡介

  《智能信息處理:漢語語料庫加工技術(shù)及應(yīng)用》以作者主持的國家項目、省部級項目及合作項目等為依托,以課題組近年來的研究成果為基礎(chǔ),重點介紹語料庫深加工中的若干技術(shù)和方法,涉及分詞、詞性標(biāo)注、句法分析、語義標(biāo)注以及相關(guān)加工中的自動校對和一致性檢驗技術(shù)。同時,對語料庫加工質(zhì)量的評價技術(shù)和語料庫的相關(guān)應(yīng)用做了詳細(xì)介紹。各章節(jié)的順序展示了語料庫加工中由淺人深的發(fā)展過程?!吨悄苄畔⑻幚恚簼h語語料庫加工技術(shù)及應(yīng)用》可作為計算機、語言學(xué)等專業(yè)高年級本科生、研究生教材,也可作為自然語言處理和計算語言學(xué)研究人員的參考書。

作者簡介

暫缺《智能信息處理:漢語語料庫加工技術(shù)及應(yīng)用》作者簡介

圖書目錄

《智能科學(xué)技術(shù)著作叢書》序
前言
第1章 緒論
1.1 語料庫的定義和作用
1.1.1 什么是語料庫
1.1.2 語料庫的作用
1.2 語料庫的建立
1.2.1 什么是語料庫標(biāo)注
1.2.2 語料庫標(biāo)注的原則
1.2.3 建立語料庫需要考慮的幾個問題
1.2.4 語料庫標(biāo)注和建立的方法
1.2.5 語料庫的質(zhì)量檢驗
1.3 本書的編排
參考文獻
第2章 自動分詞
2.1 自動分詞概述
2.1.1 自動分詞的意義
2.1.2 自動分詞的主要難點
2.1.3 自動分詞方法簡介
2.1.4 自動分詞評測
2.2 分詞規(guī)范
2.2.1 制定分詞規(guī)范的目的和意義
2.2.2 幾種典型的分詞規(guī)范介紹
2.3 歧義字段的切分技術(shù)
2.3.1 歧義字段現(xiàn)象分析
2.3.2 基于統(tǒng)計的歧義字段排歧
2.4 未登錄詞識別
2.4.1 專有名詞識別
2.4.2 新詞語識別
2.5 縮略語識別
2.5.1 縮略語特征分析
2.5.2 縮略語資源庫的建立
2.5.3 縮略語識別模型
2.5.4 縮略語的還原
2.6 分詞一致性檢驗
2.6.1 分詞不一致性現(xiàn)象分析
2.6.2 基于規(guī)則的分詞一致性檢驗方法
2.6.3 基于統(tǒng)計的分詞一致性檢驗方法
2.6.4 分詞一致性檢驗系統(tǒng)
參考文獻
第3章 詞性標(biāo)注
3.1 詞性標(biāo)注概述
3.1.1 詞性標(biāo)注的意義
3.1.2 詞性標(biāo)注的難點
3.1.3 詞性標(biāo)注方法簡介
3.1.4 常用語料庫
3.2 詞性標(biāo)注規(guī)范
3.2.1 制定詞性標(biāo)注規(guī)范的目的和意義
3.2.2 幾種典型的詞性標(biāo)注規(guī)范介紹
3.3 兼類詞的標(biāo)注
3.3.1 什么是兼類詞
3.3.2 典型的兼類詞標(biāo)注方法
3.4 詞性標(biāo)注一致性檢驗
3.4.1 問題描述和分析
3.4.2 一致性檢驗?zāi)P偷慕?br /> 3.4.3 實驗結(jié)果和分析
3.4.4 方法評價
3.5 詞性標(biāo)注自動校對
3.5.1 基于分類的詞性標(biāo)注自動校對
3.5.2 基于決策表的詞性標(biāo)注自動校對
參考文獻
第4章 句法分析
4.1 完全句法分析
4.1.1 完全句法分析概述
4.1.2 形式語法體系
4.1.3 樹庫資源的建設(shè)
4.1.4 漢語句法分析的特點
4.1.5 句法分析方法
4.1.6 相關(guān)會議及評測
4.1.7 句法分析模型的評價方法
4.2 淺層句法分析
4.2.1 淺層句法分析概述
4.2.2 組塊庫的獲取
4.2.3 組塊的類型及其標(biāo)注規(guī)范
4.2.4 組塊分析方法
4.2.5 相關(guān)會議及評測
4.2.6 評價參數(shù)
4.3 句法樹庫的一致性檢驗
4.3.1 不一致現(xiàn)象分析
4.3.2 不一致的發(fā)現(xiàn)和消解
參考文獻
第5章 語義標(biāo)注語料庫
5.1 語義標(biāo)注范圍
5.1.1 詞義標(biāo)注
5.1.2 句義標(biāo)注
5.1.3 篇章級的語義標(biāo)注
5.2 語義標(biāo)注語料庫的建立方法
5.2.1 傳統(tǒng)的以人工標(biāo)注為主的方法
5.2.2 自動構(gòu)建語義標(biāo)注語料庫
5.3 主要的語義標(biāo)注語料庫
5.3.1 詞義標(biāo)注語料庫
5.3.2 句義標(biāo)注語料庫
5.3.3 語篇關(guān)系標(biāo)注語料庫
5.3.4 時間關(guān)系標(biāo)注語料庫
5.3.5 信息抽取方面的語料庫
5.3.6 生物醫(yī)藥領(lǐng)域中的語義標(biāo)注語料庫
參考文獻
第6章 語料庫評測
6.1 語料庫評測的意義
6.2 語料庫分詞質(zhì)量評價
6.2.1 評價樣本的抽樣
6.2.2 抽樣樣本的聚類及評價
6.2.3 實驗及分析
6.3 語料庫可用性評價
6.3.1 可用性評價體系
6.3.2 可用性評價計算
6.3.3 評價結(jié)果分析
參考文獻
第7章 基于語料庫的應(yīng)用研究
7.1 網(wǎng)頁信息處理
7.1.1 重復(fù)網(wǎng)頁分析
7.1.2 基于語義的網(wǎng)頁去重
7.1.3 基于網(wǎng)頁文本結(jié)構(gòu)的網(wǎng)頁去重
7.2 特殊領(lǐng)域的信息抽取
7.2.1 基于HMM的農(nóng)業(yè)信息抽取
7.2.2 基于NLP的土壤污染數(shù)據(jù)抽取
7.2.3 基于BOotstrapping的交通工具名識別
7.3 基于大規(guī)模語料庫的漢語韻律邊界研究
7.3.1 基于統(tǒng)計語言模型建立二叉樹結(jié)構(gòu)
7.3.2 基于樹結(jié)構(gòu)的漢語韻律邊界預(yù)測
7.4 基于大規(guī)模語料庫的欺騙行為檢測
7.4.1 欺騙性語料庫的建設(shè)
7.4.2 欺騙檢測的特征線索
7.4.3 文本特征抽取
7.4.4 欺騙行為檢測方法
7.4.5 實驗結(jié)果和分析
參考文獻

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.dappsexplained.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號