注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫(kù)Greenplum企業(yè)應(yīng)用實(shí)戰(zhàn)

Greenplum企業(yè)應(yīng)用實(shí)戰(zhàn)

Greenplum企業(yè)應(yīng)用實(shí)戰(zhàn)

定 價(jià):¥69.00

作 者: 何勇,陳曉峰 著
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng): 數(shù)據(jù)庫(kù)技術(shù)叢書(shū)
標(biāo) 簽: 暫缺

購(gòu)買這本書(shū)可以去


ISBN: 9787111481003 出版時(shí)間: 2014-10-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 336 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  這是國(guó)內(nèi)首本Greenplum著作,國(guó)內(nèi)最早開(kāi)始使用Greenplum的企業(yè)是阿里巴巴,《Greenplum企業(yè)應(yīng)用實(shí)戰(zhàn)》的兩位作者是阿里巴巴最早負(fù)責(zé)使用和維護(hù)Greenplum的技術(shù)工程師,權(quán)威性毋庸置疑。《Greenplum企業(yè)應(yīng)用實(shí)戰(zhàn)》完全立足于阿里巴巴的企業(yè)應(yīng)用實(shí)踐,不僅系統(tǒng)介紹Greenplum的功能特性、使用方法、高級(jí)應(yīng)用,而且還詳細(xì)講解Greenplum的系統(tǒng)架構(gòu)、運(yùn)維管理、性能優(yōu)化和各種技巧。最重要的是,包含大量企業(yè)級(jí)應(yīng)用案例,每個(gè)案例都進(jìn)行了詳盡的講解和實(shí)操指導(dǎo)?!禛reenplum企業(yè)應(yīng)用實(shí)戰(zhàn)》一共15章,分為三個(gè)部分:基礎(chǔ)篇(第1~3章)首先介紹了Greenplum的應(yīng)用場(chǎng)景、功能特性以及與PostgreSQL的關(guān)系,然后講解了Greenplum的安裝配置、語(yǔ)法以及相關(guān)操作,最后通過(guò)兩個(gè)具體的數(shù)據(jù)倉(cāng)庫(kù)ETL案例加強(qiáng)讀者對(duì)Greenplum的功能特性的了解和操作能力;進(jìn)階篇(第4~7章)圍繞數(shù)據(jù)字典、執(zhí)行計(jì)劃、系統(tǒng)架構(gòu)、高級(jí)特性等主題對(duì)Greenplum進(jìn)行了更深入地講解,不僅能讓讀者更深入理解Greenplum的工作原理,也能讓讀者游刃有余地應(yīng)對(duì)各種日常操作;管理篇(8~15章)從運(yùn)維和管理的角度講解了Greenplum的線上部署、數(shù)據(jù)庫(kù)管理、腳本維護(hù)、監(jiān)控、權(quán)限控制、容災(zāi)/擴(kuò)容、備份恢復(fù)、性能調(diào)優(yōu)、常用技巧和常見(jiàn)問(wèn)題等。

作者簡(jiǎn)介

  陳曉峰,資深數(shù)據(jù)庫(kù)專家和高級(jí)開(kāi)發(fā)工程師,對(duì)Greenplum和PostgreSQL等數(shù)據(jù)庫(kù)以及Hadoop和Storm等大數(shù)據(jù)技術(shù)有非常深入的研究和豐富的實(shí)踐經(jīng)驗(yàn)。曾就職于阿里巴巴數(shù)據(jù)平臺(tái)部和數(shù)據(jù)平臺(tái)事業(yè)部,負(fù)責(zé)數(shù)據(jù)倉(cāng)庫(kù)Greenplum計(jì)算集群、報(bào)表集群的維護(hù)及調(diào)優(yōu),擔(dān)任RTDC項(xiàng)目和天罡項(xiàng)目的技術(shù)負(fù)責(zé)人,以及負(fù)責(zé)雙十一的交易直播間項(xiàng)目;現(xiàn)就職于阿里巴巴小微金服集團(tuán)保險(xiǎn)事業(yè)部,負(fù)責(zé)保險(xiǎn)事業(yè)部所有險(xiǎn)種的核保核賠。熟悉Java、C、C++、Python,以及數(shù)據(jù)挖掘和數(shù)據(jù)分析相關(guān)技術(shù)。何勇,資深數(shù)據(jù)庫(kù)專家和軟件架構(gòu)師,對(duì)Greenplum、Oracle、Teradata、MySQL以及各種NoSQL都有非常深入的研究,實(shí)戰(zhàn)經(jīng)驗(yàn)豐富。曾就職于阿里巴巴和盛大,從事數(shù)據(jù)庫(kù)系統(tǒng)架構(gòu)、軟件架構(gòu)和數(shù)據(jù)中心相關(guān)的工作。熟悉Perl、Python、Java、C,以及移動(dòng)開(kāi)發(fā)。杭州遙指科技有限公司聯(lián)合創(chuàng)始人兼CTO。

圖書(shū)目錄

上篇 基 礎(chǔ) 篇
第1章 Greenplum簡(jiǎn)介
1.1 Greenplum的起源和發(fā)展歷程
1.2 OLTP與OLAP
1.3 PostgreSQL與Greenplum的關(guān)系
1.3.1 PostgreSQL
1.3.2 Greenplum
1.4 Greenplum特性及應(yīng)用場(chǎng)景
1.4.1 Greenplum特性
1.4.2 Greenplum應(yīng)用場(chǎng)景
1.5 小結(jié)
第2章 Greenplum快速入門
2.1 軟件安裝及數(shù)據(jù)庫(kù)初始化
2.1.1 Greenplum架構(gòu)
2.1.2 環(huán)境搭建
2.1.3 Greenplum安裝
2.1.4 創(chuàng)建數(shù)據(jù)庫(kù)
2.1.5 數(shù)據(jù)庫(kù)啟動(dòng)與關(guān)閉
2.2 安裝Greenplum的常見(jiàn)問(wèn)題
2.2.1 /etc/hosts配置錯(cuò)誤
2.2.2 MASTER_DATA_DIRECTORY設(shè)置錯(cuò)誤
2.3 暢游Greenplum
2.3.1 如何訪問(wèn)Greenplum
2.3.2 數(shù)據(jù)庫(kù)整體概況
2.3.3 基本語(yǔ)法介紹
2.3.4 常用數(shù)據(jù)類型
2.3.5 常用函數(shù)
2.3.6 分析函數(shù)
2.3.7 分區(qū)表
2.3.8 外部表
2.3.9 COPY命令
2.4 小結(jié)
第3章 Greenplum實(shí)戰(zhàn)
3.1 歷史拉鏈表
3.1.1 應(yīng)用場(chǎng)景描述
3.1.2 原理及步驟
3.1.3 表結(jié)構(gòu)
3.1.4 Demo數(shù)據(jù)準(zhǔn)備
3.1.5 數(shù)據(jù)加載
3.1.6 數(shù)據(jù)刷新
3.1.7 分區(qū)裁剪
3.1.8 數(shù)據(jù)導(dǎo)出
3.2 日志分析
3.2.1 應(yīng)用場(chǎng)景描述
3.2.2 數(shù)據(jù)Demo
3.2.3 日志分析實(shí)戰(zhàn)
3.3 數(shù)據(jù)分布
3.3.1 數(shù)據(jù)分散情況查看
3.3.2 數(shù)據(jù)加載速度影響
3.3.3 數(shù)據(jù)查詢速度影響
3.4 數(shù)據(jù)壓縮
3.4.1 數(shù)據(jù)加載速度影響
3.4.2 數(shù)據(jù)查詢速度影響
3.5 索引
3.6 小結(jié)
中篇 進(jìn) 階 篇
第4章 數(shù)據(jù)字典詳解
4.1 oid無(wú)處不在
4.2 數(shù)據(jù)庫(kù)集群信息
4.2.1 Gp_configuration和gp_segment_configuration
4.2.2 Gp_id
4.2.3 Gp_configuration_history
4.2.4 pg_filespace_entry
4.2.5 集群配置信息表轉(zhuǎn)化
4.3 常用數(shù)據(jù)字典
4.3.1 pg_class
4.3.2 pg_attribute
4.3.3 gp_distribution_policy
4.3.4 pg_statistic和pg_stats
4.4 分區(qū)表信息
4.4.1 如何實(shí)現(xiàn)分區(qū)表
4.4.2 pg_partition
4.4.3 pg_partition_rule
4.4.4 pg_partitions視圖及其優(yōu)化
4.5 自定義類型以及類型轉(zhuǎn)換
4.6 主、備節(jié)點(diǎn)同步的相關(guān)數(shù)據(jù)字典
4.7 數(shù)據(jù)字典應(yīng)用示例
4.7.1 獲取表的字段信息
4.7.2 獲取表的分布鍵
4.7.3 獲取一個(gè)視圖的定義
4.7.4 查詢comment(備注信息)
4.7.5 獲取數(shù)據(jù)庫(kù)建表語(yǔ)句
4.7.6 查詢表上的視圖
4.7.7 查詢表的數(shù)據(jù)文件創(chuàng)建時(shí)間
4.7.8 分區(qū)表總大小
4.7.9 如何分析數(shù)據(jù)字典變化
4.7.10 獲取數(shù)據(jù)庫(kù)鎖信息
4.8 Gp_toolkit介紹
4.9 小結(jié)
第5章 執(zhí)行計(jì)劃詳解
5.1 執(zhí)行計(jì)劃入門
5.1.1 什么是執(zhí)行計(jì)劃
5.1.2 查看執(zhí)行計(jì)劃
5.2 分布式執(zhí)行計(jì)劃概述
5.2.1 架構(gòu)
5.2.2 重分布與廣播
5.2.3 Greenplum Master的工作
5.3 Greenplum執(zhí)行計(jì)劃中的術(shù)語(yǔ)
5.3.1 數(shù)據(jù)掃描方式
5.3.2 分布式執(zhí)行
5.3.3 兩種聚合方式
5.3.4 關(guān)聯(lián)
5.3.5 SQL消耗
5.3.6 其他術(shù)語(yǔ)
5.4 數(shù)據(jù)庫(kù)統(tǒng)計(jì)信息收集
5.4.1 Analyze分析
5.4.2 固定執(zhí)行計(jì)劃
5.5 控制執(zhí)行計(jì)劃的參數(shù)介紹
5.6 規(guī)劃器開(kāi)銷的計(jì)算方法
5.7 各種執(zhí)行計(jì)劃原理分析
5.7.1 詳解關(guān)聯(lián)的廣播與重分布
5.7.2 HashAggregate與GroupAggregate
5.7.3 Nestloop Join 、 Hash Join 與Merge Join
5.7.4 分析函數(shù):開(kāi)窗函數(shù)和grouping sets
5.8 案例
5.8.1 關(guān)聯(lián)鍵強(qiáng)制類型轉(zhuǎn)換,導(dǎo)致重分布
5.8.2 統(tǒng)計(jì)信息過(guò)期
5.8.3 執(zhí)行計(jì)劃出錯(cuò)
5.8.4 分布鍵選擇不恰當(dāng)
5.8.5 計(jì)算distinct
5.8.6 union與union all
5.8.7 子查詢not in
5.8.8 聚合函數(shù)太多導(dǎo)致內(nèi)存不足
5.9 小結(jié)
第6章 Greenplum高級(jí)應(yīng)用
6.1 Appendonly表與壓縮表
6.1.1 應(yīng)用場(chǎng)景及語(yǔ)法介紹
6.1.2 壓縮表的性能差異
6.1.3 Appendonly表特性
6.1.4 相關(guān)數(shù)據(jù)字典
6.2 列存儲(chǔ)
6.2.1 應(yīng)用場(chǎng)景
6.2.2 數(shù)據(jù)文件存儲(chǔ)特性
6.2.3 如何使用列存儲(chǔ)
6.2.4 性能比較
6.3 外部表高級(jí)應(yīng)用
6.3.1 外部表實(shí)現(xiàn)原理
6.3.2 可寫(xiě)外部表
6.3.3 HDFS外部表
6.3.4 可執(zhí)行外部表
6.4 自定義函數(shù)-各個(gè)編程接口
6.4.1 pl/pgsql
6.4.2 C語(yǔ)言接口
6.4.3 plpython
6.5 Greenplum MapReduce
6.6 小結(jié)
第7章 Greenplum架構(gòu)介紹
7.1 并行和分布式計(jì)算
7.2 并行數(shù)據(jù)庫(kù)
7.3 Greenplum架構(gòu)分析
7.4 冗余與故障切換
7.5 數(shù)據(jù)分布及負(fù)載均衡
7.6 跨庫(kù)關(guān)聯(lián)
7.7 分布式事務(wù)
7.8 其他大數(shù)據(jù)分析方案
7.9 小結(jié)
下篇 管 理 篇
第8章 Greenplum線上環(huán)境部署
8.1 服務(wù)器硬件選型
8.1.1 CPU
8.1.2 內(nèi)存
8.1.3 磁盤及硬盤接口
8.1.4 網(wǎng)絡(luò)
8.2 服務(wù)器系統(tǒng)參數(shù)調(diào)整
8.2.1 Solaris參數(shù)修改
8.2.2 Linux參數(shù)修改
8.2.3 系統(tǒng)參數(shù)及性能驗(yàn)證
8.3 計(jì)算節(jié)點(diǎn)分配技巧
8.4 數(shù)據(jù)庫(kù)參數(shù)介紹
8.5 數(shù)據(jù)庫(kù)集群基準(zhǔn)測(cè)試
8.6 小結(jié)
第9章 數(shù)據(jù)庫(kù)管理
9.1 用戶及權(quán)限管理
9.1.1 Greenplum數(shù)據(jù)庫(kù)邏輯結(jié)構(gòu)
9.1.2 Grant語(yǔ)法
9.2 登錄權(quán)限控制
9.3 資源隊(duì)列及并發(fā)控制
9.4 Greenplum鎖機(jī)制
9.5 數(shù)據(jù)目錄結(jié)構(gòu)
9.6 數(shù)據(jù)文件存儲(chǔ)分布
9.7 表空間管理
9.8 小結(jié)
第10章 數(shù)據(jù)庫(kù)監(jiān)控及調(diào)優(yōu)
10.1 Linux監(jiān)控工具介紹
10.1.1 監(jiān)控磁盤
10.1.2 監(jiān)控網(wǎng)絡(luò)
10.1.3 監(jiān)控CPU
10.1.4 監(jiān)控內(nèi)存
10.2 安裝Performance Monitor
10.3 監(jiān)控Segment是否正常
10.4 VACUUM系統(tǒng)表
10.5 數(shù)據(jù)傾斜排查
10.6 查看子節(jié)點(diǎn)的SQL運(yùn)行狀態(tài)
10.7 自動(dòng)加分區(qū)
10.8 自動(dòng)賦權(quán)
10.9 清理過(guò)期數(shù)據(jù)
10.10 小結(jié)
第11章 解讀Greenplum維護(hù)腳本
11.1 添加Greenplum Contrib模塊
11.2 啟動(dòng)和關(guān)閉腳本gpstart和gpstop
11.3 初始化系統(tǒng)腳本gpinitsystem
11.4 集群操作腳本gpssh和gpscp
11.5 數(shù)據(jù)庫(kù)狀態(tài)檢查腳本gpstate
11.6 數(shù)據(jù)庫(kù)升級(jí)腳本gpmigrate
11.7 參數(shù)修改腳本gpconfig
11.8 數(shù)據(jù)庫(kù)一致性檢查腳本gpcheckcat
11.9 小結(jié)
第12章 備份及恢復(fù)策略
12.1 Greenplum 3.x
12.2 Greenplum 4.x
12.3 gp_dump和pg_dump
12.4 Greenplum Master備份策略
12.4.1 增加Standby Master
12.4.2 重新同步Standby Master
12.4.3 啟用Standby Master
12.5 小結(jié)
第13章 數(shù)據(jù)庫(kù)擴(kuò)容
13.1 遷移計(jì)算節(jié)點(diǎn)
13.1.1 兩種備份方案
13.1.2 數(shù)據(jù)遷移實(shí)戰(zhàn)
13.2 增加計(jì)算節(jié)點(diǎn)
13.3 小結(jié)
第14章 基于Greenplum的海量數(shù)據(jù)實(shí)時(shí)分析服務(wù)平臺(tái)
14.1 需求概述
14.2 典型方案
14.2.1 NoSQL
14.2.2 分布式數(shù)據(jù)庫(kù)/集群
14.2.3 分表分庫(kù)
14.2.4 方案優(yōu)劣分析
14.3 基于Greenplum的混合架構(gòu)
14.3.1 架構(gòu)分析
14.3.2 實(shí)施要點(diǎn)
14.4 小結(jié)
第15章 使用Greenplum的常見(jiàn)報(bào)錯(cuò)及小技巧
15.1 分析常見(jiàn)報(bào)錯(cuò)
15.2 常見(jiàn)問(wèn)題及解決辦法
15.3 常用的一些小技巧
15.4 小結(jié)

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) www.dappsexplained.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)