注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)Python數(shù)據(jù)分析從入門(mén)到精通

Python數(shù)據(jù)分析從入門(mén)到精通

Python數(shù)據(jù)分析從入門(mén)到精通

定 價(jià):¥99.00

作 者: 李梓萌 著
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng): Python開(kāi)發(fā)從入門(mén)到精通系列
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787111649885 出版時(shí)間: 2020-04-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 345 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  Python數(shù)據(jù)分析從入門(mén)到精通循序漸進(jìn)地講解了使用Python語(yǔ)言實(shí)現(xiàn)數(shù)據(jù)分析的核心知識(shí),并通過(guò)具體實(shí)例的實(shí)現(xiàn)過(guò)程演示了數(shù)據(jù)分析的方法和流程。Python數(shù)據(jù)分析從入門(mén)到精通共12章,內(nèi)容包括Python語(yǔ)言基礎(chǔ)、處理網(wǎng)絡(luò)數(shù)據(jù)、網(wǎng)絡(luò)爬蟲(chóng)實(shí)戰(zhàn)、處理特殊文本格式、使用數(shù)據(jù)庫(kù)保存數(shù)據(jù)、操作處理CSV文件、操作處理JSON數(shù)據(jù)、使用庫(kù)matplotlib實(shí)現(xiàn)數(shù)據(jù)可視化處理、使用庫(kù)pygal實(shí)現(xiàn)數(shù)據(jù)可視化處理、使用庫(kù)numPy實(shí)現(xiàn)數(shù)據(jù)可視化處理、使用庫(kù)pandas實(shí)現(xiàn)數(shù)據(jù)可視化處理和大數(shù)據(jù)實(shí)戰(zhàn)案例。Python數(shù)據(jù)分析從入門(mén)到精通簡(jiǎn)潔而不失技術(shù)深度,內(nèi)容豐富全面。不僅易于閱讀,同時(shí)涵蓋了其他同類(lèi)圖書(shū)中很少涉及的參考資料,是學(xué)習(xí)Python數(shù)據(jù)分析的實(shí)用教程。 Python數(shù)據(jù)分析從入門(mén)到精通適用于已了解Python語(yǔ)言基礎(chǔ)語(yǔ)法、希望進(jìn)一步提高自己Python開(kāi)發(fā)水平的讀者,還可作為大中專(zhuān)院校和培訓(xùn)學(xué)校相關(guān)專(zhuān)業(yè)師生的學(xué)習(xí)參考用書(shū)。

作者簡(jiǎn)介

  李梓萌,女,高級(jí)工程師,畢業(yè)于清華大學(xué),,供職于阿里巴巴淘寶事業(yè)部。工作項(xiàng)目涉及金融科技、證券交易所、銀行、生物信息學(xué)、基因組學(xué)、廣告技術(shù)、基礎(chǔ)設(shè)施、交通運(yùn)輸、能源、人力資源和娛樂(lè)等多個(gè)領(lǐng)域的數(shù)據(jù)分析工作。在預(yù)測(cè)分析、數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)、大數(shù)據(jù)、產(chǎn)品工程、高性能計(jì)算和云基礎(chǔ)設(shè)施等項(xiàng)目中工作了8年。

圖書(shū)目錄

目錄

前言

第1章 Python語(yǔ)言基礎(chǔ)1
1.1 Python語(yǔ)言介紹1
1.1.1 Python語(yǔ)言的地位1
1.1.2 Python語(yǔ)言的優(yōu)點(diǎn)2
1.2 安裝Python3
1.2.1 在Windows系統(tǒng)中下載并安裝
Python3
1.2.2 在MacOS系統(tǒng)中下載并安裝
Python6
1.2.3 在Linux系統(tǒng)中下載并安裝
Python6
1.3 Python開(kāi)發(fā)工具介紹7
1.3.1 使用Python自帶的開(kāi)發(fā)工具
IDLE7
1.3.2 使用流行工具PyCharm7
1.4 認(rèn)識(shí)第一段Python程序11
1.4.1 使用IDLE編碼并運(yùn)行11
1.4.2 使用命令行方式運(yùn)行Python
程序12
1.4.3 使用交互式方式運(yùn)行Python
程序12
1.4.4 使用PyCharm實(shí)現(xiàn)第一個(gè)Python
程序13
第2章 處理網(wǎng)絡(luò)數(shù)據(jù)17
2.1 處理HTML和XML數(shù)據(jù)17
2.1.1 解析XML數(shù)據(jù)17
2.1.2 使用庫(kù)beautiful soup解析數(shù)據(jù)25
2.1.3 使用庫(kù)bleach解析數(shù)據(jù)27
2.1.4 使用庫(kù)cssutils解析數(shù)據(jù)29
2.1.5 使用庫(kù)html5lib解析數(shù)據(jù)31
2.1.6 使用庫(kù)markupsafe解析數(shù)據(jù)31
2.1.7 使用庫(kù)pyquery解析數(shù)據(jù)32
2.2 處理HTTP 數(shù)據(jù)34
2.2.1 使用內(nèi)置的http包處理數(shù)據(jù)34
2.2.2 使用庫(kù)requests處理數(shù)據(jù)36
2.2.3 使用庫(kù)httplib2處理數(shù)據(jù)37
2.2.4 使用庫(kù)urllib3處理數(shù)據(jù)41
2.3 處理URL 數(shù)據(jù)44
2.3.1 使用urllib包44
2.3.2 使用庫(kù)furl處理數(shù)據(jù)47
2.3.3 使用庫(kù)purl處理數(shù)據(jù)48
2.3.4 使用庫(kù)webargs處理數(shù)據(jù)50
2.4 爬取新聞保存到XML文件并分析
特征關(guān)系50
2.4.1 爬蟲(chóng)抓取數(shù)據(jù)51
2.4.2 使用Stanford CoreNLP提取XML
數(shù)據(jù)的特征關(guān)系52
第3章 網(wǎng)絡(luò)爬蟲(chóng)實(shí)戰(zhàn)54
3.1 網(wǎng)絡(luò)爬蟲(chóng)基礎(chǔ)54
3.2 開(kāi)發(fā)簡(jiǎn)單的網(wǎng)絡(luò)爬蟲(chóng)應(yīng)用程序55
3.2.1 爬蟲(chóng)抓取某高校教師信息55
3.2.2 抓取某吧的信息59
3.2.3 抓取XX百科64
3.2.4 爬蟲(chóng)抓取某網(wǎng)站的信息并保存到
本地68
3.3 使用爬蟲(chóng)框架Scrapy70
3.3.1 Scrapy框架基礎(chǔ)71
3.3.2 搭建Scrapy環(huán)境72
3.3.3 創(chuàng)建第一個(gè)Scrapy項(xiàng)目72
3.3.4 抓取某電影網(wǎng)的熱門(mén)電影信息76
3.3.5 抓取某網(wǎng)站中的照片并保存到
本地81
3.3.6 抓取某網(wǎng)站中的主播照片并保存到
本地82
第4章 處理特殊文本格式84
4.1 使用tablib模塊84
4.1.1 基本用法84
4.1.2 操作數(shù)據(jù)集中的指定行和列86
4.1.3 刪除并導(dǎo)出不同格式的數(shù)據(jù)87
4.1.4 生成一個(gè)Excel文件88
4.1.5 處理多個(gè)數(shù)據(jù)集89
4.1.6 使用標(biāo)簽過(guò)濾數(shù)據(jù)92
4.1.7 分離表格中的數(shù)據(jù)92
4.2 使用openpyxl處理Office
文件93
4.2.1 openpyxl基礎(chǔ)93
4.2.2 使用openpyxl讀取Excel文件的
數(shù)據(jù)96
4.2.3 將4組數(shù)據(jù)導(dǎo)入Excel文件96
4.2.4 在Excel文件中檢索某關(guān)鍵字
數(shù)據(jù)98
4.2.5 將數(shù)據(jù)導(dǎo)入Excel文件并生成一個(gè)
圖表99
4.3 使用pyexcel處理Office
文件100
4.3.1 使用pyexcel讀取并寫(xiě)入CSV
文件100
4.3.2 使用pyexcel讀取指定Excel文件中
每個(gè)單元格數(shù)據(jù)101
4.3.3 按列讀取并顯示指定Excel文件中
每個(gè)單元格數(shù)據(jù)102
4.3.4 讀取顯示Excel文件中的所有
數(shù)據(jù)102
4.3.5 將3組數(shù)據(jù)導(dǎo)入新建的Excel
文件103
4.3.6 以多種方式獲取Excel數(shù)據(jù)104
4.3.7 將數(shù)據(jù)分別導(dǎo)入Excel文件和SQLite
數(shù)據(jù)庫(kù)105
4.3.8 在Flask Web項(xiàng)目中使用pyexcel處理
數(shù)據(jù)106
4.4 使用python-docx處理Office
文件109
4.4.1 使用python-docx處理Office文件的
流程109
4.4.2 創(chuàng)建Word文檔110
4.4.3 在Word中插入圖片110
4.4.4 創(chuàng)建結(jié)構(gòu)文檔112
4.4.5 讀取Word文檔114
4.5 使用xlrd和xlwt讀寫(xiě)Excel115
4.5.1 使用庫(kù)xlrd115
4.5.2 使用庫(kù)xlwt117
4.6 使用xlsxwriter操作Excel
文件118
4.6.1 使用庫(kù)xlsxwriter的基本流程118
4.6.2 創(chuàng)建一個(gè)表格118
4.6.3 設(shè)置表格樣式120
4.6.4 向Excel文件中插入圖像122
4.6.5 向Excel文件中插入數(shù)據(jù)并繪制
柱狀圖123
4.6.6 向Excel文件中插入數(shù)據(jù)并繪制
散點(diǎn)圖125
4.6.7 向Excel文件中插入數(shù)據(jù)并繪制
柱狀圖和餅狀圖126
第5章 使用數(shù)據(jù)庫(kù)保存數(shù)據(jù)129
5.1 操作SQLite3數(shù)據(jù)庫(kù)129
5.1.1 sqlite3模塊介紹129
5.1.2 使用sqlite3模塊操作SQLite3
數(shù)據(jù)庫(kù)130
5.1.3 使用Flask+ SQLite3+ ECharts2實(shí)現(xiàn)
降水?dāng)?shù)據(jù)可視化系統(tǒng)132
5.2 操作MySQL數(shù)據(jù)庫(kù)138
5.2.1 搭建PyMySQL環(huán)境138
5.2.2 實(shí)現(xiàn)數(shù)據(jù)庫(kù)連接139
5.2.3 創(chuàng)建數(shù)據(jù)庫(kù)表140
5.2.4 爬取XX站用戶(hù)信息并保存到
MySQL數(shù)據(jù)庫(kù)141
5.3 使用MariaDB數(shù)據(jù)庫(kù)145
5.3.1 搭建MariaDB數(shù)據(jù)庫(kù)環(huán)境145
5.3.2 在Python程序中使用MariaDB
數(shù)據(jù)庫(kù)148
5.4 使用MongoDB數(shù)據(jù)庫(kù)150
5.4.1 搭建MongoDB環(huán)境150
5.4.2 在Python程序中使用MongoDB
數(shù)據(jù)庫(kù)151
5.5 使用ORM操作數(shù)據(jù)庫(kù)154
5.5.1 Python和ORM154
5.5.2 使用SQLAlchemy155
5.5.3 使用mongoengine160
第6章 操作處理CSV文件163
6.1 內(nèi)置CSV模塊介紹163
6.1.1 內(nèi)置成員163
6.1.2 操作CSV文件165
6.1.3 提取CSV數(shù)據(jù)并保存到MySQL
數(shù)據(jù)庫(kù)172
6.1.4 提取CSV數(shù)據(jù)并保存到SQLite
數(shù)據(jù)庫(kù)176
6.2 爬取圖書(shū)信息并保存為CSV
文件178
6.2.1 實(shí)例介紹178
6.2.2 具體實(shí)現(xiàn)178
6.3 使用CSV文件保存Scrapy抓取的
數(shù)據(jù)181
6.3.1 搭建Scrap

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) www.dappsexplained.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)