本書特色
用傳統(tǒng)的電子表格來處理數(shù)據(jù)不僅效率低下,而且無法處理某些格式的數(shù)據(jù),對于混亂或龐大的數(shù)據(jù)集更是束手無策。本書將教你如何利用語法簡單、容易上手的Python輕松處理數(shù)據(jù)。作者通過循序漸進(jìn)的練習(xí),詳細(xì)介紹如何有效地獲取、清洗、分析與呈現(xiàn)數(shù)據(jù),如何將數(shù)據(jù)處理過程自動化,如何安排文件編輯與清洗任務(wù),如何處理更大的數(shù)據(jù)集,以及如何利用獲取的數(shù)據(jù)來創(chuàng)作引人入勝的故事。學(xué)完本書,你的數(shù)據(jù)處理和分析能力將更上一層樓。
- 快速了解Python基本語法、數(shù)據(jù)類型和語言概念
- 概述數(shù)據(jù)的獲取與存儲方式
- 清洗數(shù)據(jù)并格式化,以消除數(shù)據(jù)集中的重復(fù)值與錯誤
- 學(xué)習(xí)何時對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,何時對數(shù)據(jù)清理進(jìn)行測試并將其腳本化
- 使用Scrapy寫網(wǎng)絡(luò)爬蟲
- 利用新的Python庫和技術(shù)對數(shù)據(jù)集進(jìn)行探索與分析
- 使用Python解決方案將整個數(shù)據(jù)處理過程自動化
“如果你一直感覺電子表格(甚至關(guān)系型數(shù)據(jù)庫)無法回答你想要提出的問題,或者除這些工具之外你準(zhǔn)備進(jìn)一步學(xué)習(xí),那么這本書非常適合你。我一直在等待這本書的出現(xiàn)。”
——Derek Willis,ProPublica新聞應(yīng)用開發(fā)者,OpenElections聯(lián)合創(chuàng)始人
“所有新手?jǐn)?shù)據(jù)科學(xué)家、數(shù)據(jù)工程師或其他技術(shù)方面的數(shù)據(jù)專家都應(yīng)該讀一讀這本實踐指南。數(shù)據(jù)處理領(lǐng)域正需要這樣一本書,真希望我第一次開始用Python處理數(shù)據(jù)時就能有它指導(dǎo)。”
——Tyrone Grandison博士,Proficiency Labs Intl. CEO
目錄
版權(quán)聲明
O’Reilly Media, Inc.介紹
本書贊譽(yù)
前言
第 1 章 Python 簡介
第 2 章 Python 基礎(chǔ)
第 3 章 供機(jī)器讀取的數(shù)據(jù)
第 4 章 處理 Excel 文件
第 5 章 處理 PDF 文件,以及用 Python 解決問題
第 6 章 數(shù)據(jù)獲取與存儲
第 7 章 數(shù)據(jù)清洗:研究、匹配與格式化
第 8 章 數(shù)據(jù)清洗:標(biāo)準(zhǔn)化和腳本化
第 9 章 數(shù)據(jù)探索和分析
第 10 章 展示數(shù)據(jù)
第 11 章 網(wǎng)頁抓取:獲取并存儲網(wǎng)絡(luò)數(shù)據(jù)
第 12 章 高級網(wǎng)頁抓取:屏幕抓取器與爬蟲
第 13 章 應(yīng)用編程接口
第 14 章 自動化和規(guī)模化
第 15 章 結(jié)論
附錄 A 編程語言對比
附錄 B 初學(xué)者的 Python 學(xué)習(xí)資源
附錄 C 學(xué)習(xí)命令行
附錄 D 高級 Python 設(shè)置
附錄 E Python 陷阱
附錄 F IPython 指南
附錄 G 使用亞馬遜網(wǎng)絡(luò)服務(wù)
關(guān)于作者
關(guān)于封面
下載
https://pan.baidu.com/s/1B2H_CxsXfnjRouxU6bCTRw
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯(lián)系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
