注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)網(wǎng)絡(luò)與數(shù)據(jù)通信網(wǎng)絡(luò)服務(wù)自然語(yǔ)言處理原理與技術(shù)實(shí)現(xiàn)

自然語(yǔ)言處理原理與技術(shù)實(shí)現(xiàn)

自然語(yǔ)言處理原理與技術(shù)實(shí)現(xiàn)

定 價(jià):¥79.00

作 者: 羅剛
出版社: 電子工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 操作系統(tǒng)/系統(tǒng)開(kāi)發(fā) 計(jì)算機(jī)/網(wǎng)絡(luò)

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787121286209 出版時(shí)間: 2016-05-01 包裝: 平塑
開(kāi)本: 頁(yè)數(shù): 443 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書(shū)詳細(xì)介紹自然語(yǔ)言處理各主要領(lǐng)域的原理以Java 實(shí)現(xiàn),包括中文分詞、詞性標(biāo)注、依存句法分析等。其中詳細(xì)介紹了中文分詞和詞性標(biāo)注的過(guò)程及相關(guān)算法,如隱馬爾可夫模型等。在自然語(yǔ)言處理的應(yīng)用領(lǐng)域主要介紹了信息抽取、自動(dòng)文摘、文本分類(lèi)等領(lǐng)域的基本理論和實(shí)現(xiàn)過(guò)程,此外還有問(wèn)答系統(tǒng)、語(yǔ)音識(shí)別等目前應(yīng)用非常廣泛的領(lǐng)域。在問(wèn)答系統(tǒng)的介紹中,本書(shū)特地介紹了聊天機(jī)器人的實(shí)現(xiàn)過(guò)程,從句子理解、句法分析、同義詞提取等方面揭示聊天機(jī)器人的實(shí)現(xiàn)原理。

作者簡(jiǎn)介

  羅剛,獵兔搜索創(chuàng)始人,帶領(lǐng)獵兔搜索技術(shù)開(kāi)發(fā)團(tuán)隊(duì)先后開(kāi)發(fā)出獵兔中文分詞系統(tǒng)、獵兔信息提取系統(tǒng)、獵兔智能垂直搜索系統(tǒng)以及網(wǎng)絡(luò)信息監(jiān)測(cè)系統(tǒng)等,實(shí)現(xiàn)互聯(lián)網(wǎng)信息的采集、過(guò)濾、搜索和實(shí)時(shí)監(jiān)測(cè)。曾編寫(xiě)出版《自己動(dòng)手寫(xiě)搜索引擎》、《自己動(dòng)手寫(xiě)網(wǎng)絡(luò)爬蟲(chóng)》、《使用C#開(kāi)發(fā)搜索引擎》,獲得廣泛好評(píng)。在北京和上海等地均有獵兔培訓(xùn)的學(xué)員。張子憲,聊城大學(xué)教師、中國(guó)礦業(yè)大學(xué)(北京)博士生,研究方向:自動(dòng)句法分析、機(jī)器翻譯。

圖書(shū)目錄

第1章 應(yīng)用自然語(yǔ)言處理技術(shù) 11.1 付出與回報(bào) 21.1.1 如何開(kāi)始 21.1.2 招聘人員 21.1.3 學(xué)習(xí) 31.2 開(kāi)發(fā)環(huán)境 31.3 技術(shù)基礎(chǔ) 41.3.1 Java 41.3.2 規(guī)則方法 51.3.3 統(tǒng)計(jì)方法 51.3.4 計(jì)算框架 51.3.5 文本挖掘 71.3.6 語(yǔ)義庫(kù) 71.4 本章小結(jié) 91.5 專(zhuān)業(yè)術(shù)語(yǔ) 9第2章 中文分詞原理與實(shí)現(xiàn) 112.1 接口 122.1.1 切分方案 132.1.2 詞特征 132.2 查找詞典算法 132.2.1 標(biāo)準(zhǔn)Trie樹(shù) 142.2.2 三叉Trie樹(shù) 182.2.3 詞典格式 262.3 最長(zhǎng)匹配中文分詞 272.3.1 正向最大長(zhǎng)度匹配法 282.3.2 逆向最大長(zhǎng)度匹配法 332.3.3 處理未登錄串 392.3.4 開(kāi)發(fā)分詞 432.4 概率語(yǔ)言模型的分詞方法 452.4.1 一元模型 472.4.2 整合基于規(guī)則的方法 542.4.3 表示切分詞圖 552.4.4 形成切分詞圖 622.4.5 數(shù)據(jù)基礎(chǔ) 642.4.6 改進(jìn)一元模型 752.4.7 二元詞典 792.4.8 完全二叉樹(shù)組 852.4.9 三元詞典 892.4.10 N元模型 902.4.11 N元分詞 912.4.12 生成語(yǔ)言模型 992.4.13 評(píng)估語(yǔ)言模型 1002.4.14 概率分詞的流程與結(jié)構(gòu) 1012.4.15 可變長(zhǎng)N元分詞 1022.4.16 條件隨機(jī)場(chǎng) 1032.5 新詞發(fā)現(xiàn) 1032.5.1 成詞規(guī)則 1092.6 詞性標(biāo)注 1092.6.1 數(shù)據(jù)基礎(chǔ) 1142.6.2 隱馬爾可夫模型 1152.6.3 存儲(chǔ)數(shù)據(jù) 1242.6.4 統(tǒng)計(jì)數(shù)據(jù) 1312.6.5 整合切分與詞性標(biāo)注 1332.6.6 大詞表 1382.6.7 詞性序列 1382.6.8 基于轉(zhuǎn)換的錯(cuò)誤學(xué)習(xí)方法 1382.6.9 條件隨機(jī)場(chǎng) 1412.7 詞類(lèi)模型 1422.8 未登錄詞識(shí)別 1442.8.1 未登錄人名 1442.8.2 提取候選人名 1452.8.3 最長(zhǎng)人名切分 1532.8.4 一元概率人名切分 1532.8.5 二元概率人名切分 1562.8.6 未登錄地名 1592.8.7 未登錄企業(yè)名 1602.9 平滑算法 1602.10 機(jī)器學(xué)習(xí)的方法 1642.10.1 最大熵 1652.10.2 條件隨機(jī)場(chǎng) 1702.11 有限狀態(tài)機(jī) 1712.12 地名切分 1782.12.1 識(shí)別未登錄地名 1792.12.2 整體流程 1852.13 企業(yè)名切分 1872.13.1 識(shí)別未登錄詞 1882.13.2 整體流程 1902.14 結(jié)果評(píng)測(cè) 1902.15 本章小結(jié) 1912.16 專(zhuān)業(yè)術(shù)語(yǔ) 193第3章 英文分析 1943.1 分詞 1943.1.1 句子切分 1943.1.2 識(shí)別未登錄串 1973.1.3 切分邊界 1983.2 詞性標(biāo)注 1993.3 重點(diǎn)詞匯 2023.4 句子時(shí)態(tài) 2033.5 本章小結(jié) 204第4章 依存文法分析 2054.1 句法分析樹(shù) 2054.2 依存文法 2114.2.1 中文依存文法 2114.2.2 英文依存文法 2204.2.3 生成依存樹(shù) 2324.2.4 遍歷 2354.2.5 機(jī)器學(xué)習(xí)的方法 2374.3 小結(jié) 2374.4 專(zhuān)業(yè)術(shù)語(yǔ) 238第5章 文檔排重 2395.1 相似度計(jì)算 2395.1.1 夾角余弦 2395.1.2 最長(zhǎng)公共子串 2425.1.3 同義詞替換 2465.1.4 地名相似度 2485.1.5 企業(yè)名相似度 2515.2 文檔排重 2515.2.1 關(guān)鍵詞排重 2515.2.2 SimHash 2545.2.3 分布式文檔排重 2685.2.4 使用文本排重 2695.3 在搜索引擎中使用文本排重 2695.4 本章小結(jié) 2705.5 專(zhuān)業(yè)術(shù)語(yǔ) 270第6章 信息提取 2716.1 指代消解 2716.2 中文關(guān)鍵詞提取 2736.2.1 關(guān)鍵詞提取的基本方法 2736.2.2 HITS算法應(yīng)用于關(guān)鍵詞提取 2756.2.3 從網(wǎng)頁(yè)中提取關(guān)鍵詞 2776.3 信息提取 2786.3.1 提取聯(lián)系方式 2806.3.2 從互聯(lián)網(wǎng)提取信息 2816.3.3 提取地名 2826.4 拼寫(xiě)糾錯(cuò) 2836.4.1 模糊匹配問(wèn)題 2856.4.2 正確詞表 2966.4.3 英文拼寫(xiě)檢查 2986.4.4 中文拼寫(xiě)檢查 3006.5 輸入提示 3026.6 本章小結(jié) 3036.7 專(zhuān)業(yè)術(shù)語(yǔ) 303第7章 自動(dòng)摘要 3047.1 自動(dòng)摘要技術(shù) 3057.1.1 英文文本摘要 3077.1.2 中文文本摘要 3097.1.3 基于篇章結(jié)構(gòu)的自動(dòng)摘要 3147.1.4 句子壓縮 3147.2 指代消解 3147.3 Lucene中的動(dòng)態(tài)摘要 3147.4 本章小結(jié) 3177.5 專(zhuān)業(yè)術(shù)語(yǔ) 318第8章 文本分類(lèi) 3198.1 地名分類(lèi) 3218.2 錯(cuò)誤類(lèi)型分類(lèi) 3218.3 特征提取 3228.4 關(guān)鍵詞加權(quán)法 3268.5 樸素貝葉斯 3308.6 貝葉斯文本分類(lèi) 3368.7 支持向量機(jī) 3368.7.1 多級(jí)分類(lèi) 3458.7.2 規(guī)則方法 3478.7.3 網(wǎng)頁(yè)分類(lèi) 3508.8 最大熵 3518.9 信息審查 3528.10 文本聚類(lèi) 3538.10.1 K均值聚類(lèi)方法 3538.10.2 K均值實(shí)現(xiàn) 3558.10.3 深入理解DBScan算法 3598.10.4 使用DBScan算法聚類(lèi)實(shí)例 3618.11 本章小結(jié) 3638.12 專(zhuān)業(yè)術(shù)語(yǔ) 363第9章 文本傾向性分析 3649.1 確定詞語(yǔ)的褒貶傾向 3679.2 實(shí)現(xiàn)情感識(shí)別 3689.3 本章小結(jié) 3729.4 專(zhuān)業(yè)術(shù)語(yǔ) 373第10章 問(wèn)答系統(tǒng) 37410.1 問(wèn)答系統(tǒng)的結(jié)構(gòu) 37510.1.1 提取問(wèn)答對(duì) 37610.1.2 等價(jià)問(wèn)題 37610.2 問(wèn)句分析 37710.2.1 問(wèn)題類(lèi)型 37710.2.2 句型 38110.2.3 業(yè)務(wù)類(lèi)型 38110.2.4 依存樹(shù) 38110.2.5 指代消解 38310.2.6 二元關(guān)系 38310.2.7 邏輯表示 38610.2.8 問(wèn)句模板 38610.2.9 結(jié)構(gòu)化問(wèn)句模板 38910.2.10 檢索方式 39010.2.11 問(wèn)題重寫(xiě) 39510.2.12 提取事實(shí) 39510.2.13 驗(yàn)證答案 39810.2.14 無(wú)答案的處理 39810.3 知識(shí)庫(kù) 39810.4 聊天機(jī)器人 39910.4.1 交互式問(wèn)答 40110.4.2 垂直領(lǐng)域問(wèn)答系統(tǒng) 40210.4.3 語(yǔ)料庫(kù) 40510.4.4 客戶(hù)端 40510.5 自然語(yǔ)言生成 40510.6 依存句法 40610.7 提取同義詞 41010.7.1 流程 41010.8 本章小結(jié) 41110.9 術(shù)語(yǔ)表 412第11章 語(yǔ)音識(shí)別 41311.1 總體結(jié)構(gòu) 41411.1.1 識(shí)別中文 41611.1.2 自動(dòng)問(wèn)答 41711.2 語(yǔ)音庫(kù) 41811.3 語(yǔ)音合成 41911.3.1 歸一化 42011.4 語(yǔ)音 42011.4.1 標(biāo)注 42411.4.2 相似度 42411.5 Sphinx 42411.5.1 中文訓(xùn)練集 42611.6 Julius 42911.7 本章小結(jié) 42911.8 術(shù)語(yǔ)表 429參考資源 430后記 431

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) www.dappsexplained.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)