本書從零開始系統講解了使用Pandas導入Exce1數據,然后使用P andas技術對數據做整理和分析,最后導出為不同形式的Exce1文件。完整實現了數據的導入、處理、輸出的處理流程。全書共10章。第1章為Pandas數據處理環境的搭建,第2章為使用Pandas對Excel數據讀取與保存,第3章介紹與Fandas底層數據相關的NumPy庫,第4章介紹了Pandas中DataFrame表格的增、刪、改、查等常用操作,第5章介紹了對Series與DataFrame兩種數據的運算、分支、遍歷等處理,第6章介紹了字符串的各種清洗技術,第7章介紹時間戳與時間差數據的處理,第8章介紹Pandas中分層索引及與索引相關的操作,第9章介紹了對數據的分組處理及做數據透視表處理,第10章介紹了表格的數據結構轉換,以及多表讀取與保存。書中包含相應示例,不僅可以學會理論知識還可以靈活應用。
曾賢志,Office技術培訓專家,我要自學網專家講師,特邀技術圖書作者,擅長使用VBA、SQL、Power BI、Python等技術做數據分析。著有《Power Query For Excel讓工作化繁為簡》《加薪不加班:174個Excel函數案例闖職場》《從Excel到Python:用Python輕松處理Excel數據》等與數據分析相關的技術圖書。
第1章Pandas數據處理環境搭建
1.1Pandas環境配置
1.1.1安裝Python發行版本Anaconda
1.1.2程序編寫工具Jupyter N0tebook
1.2Python基礎操作
1.2.1變量
1.2.2注釋
1.2.3代碼縮進
1.2.4數據結構
1.2.5控制語句
1.2.6函數
第2章Pandas中數據的存取
2.1讀取Excel文件數據
2.2讀取CSV文件數據
2.3保存為Excel文件格式
2.4保存為CSV文件格式
2.5Pandas中表格的結構
2.5.1DataFrame數據結構
2.5.2Series數據結構
第3章NumPy數據處理基石
3.1NumPy的定義
3.2NumPy數組的創建與轉換
3.2.1普通數組
3.2.2序列數組
3.2.3隨機數組
3.2.4轉換數組
3.3NumPy數組的預處理
3.3.1類型轉換
3.3.2缺失值處理
3.3.3重復值處理
3.4NumPy數組維度轉換
3.4.1數組維度轉換
3.4.2數組合并
3.5Series數據的創建
3.6DataFrame表格的創建
3.6.1使用NumPy數組創建DataFrame表格
3.6.2使用Python列表創建DataFrame表格
3.6.3使用Python字典創建DataFrame表格
第4章表格管理技術 ...