本書從大數據的基礎知識介紹開始,逐步引領讀者了解大數據管理與應用的前沿技術,系統地介紹了大數據管理與應用的體系化流程,包括數據采集與融合、數據存儲與管理、大數據處理與分析、大數據決策支持及其案例和實驗。本書內容深入淺出,提供了豐富的大數據案例并配套詳細的代碼,旨在幫助讀者更加清晰地理解大數據基礎知識,掌握大數據技術在管理學科中的應用。
本書可作為大數據學科本科生和研究生的教材,還可供大數據產業從業者使用。
前言
第1章大數據管理與應用概述/
1.1什么是大數據/
1.2大數據管理與應用/
1.3大數據管理與應用前沿/
1.4大數據管理與應用技術/
參考文獻/
第2章大數據技術基礎知識/
2.1Hadoop生態系統簡介/
2.2Linux簡介/
2.3Python基礎知識/
實驗一Python環境搭建/
實驗二基于Python語言的Spark實戰/
參考文獻/
第3章數據采集與融合/
3.1數據資源/
3.2常見數據采集途徑/
3.3多源數據融合/
實驗三網絡爬蟲/
實驗四Kafka操作/
參考文獻/
第4章數據存儲與管理/
4.1數據存儲簡介/
4.2分布式文件系統/
4.3數據庫和數據倉庫/
4.4數據管理/
實驗五HBase操作/
實驗六彈性搜索應用實例/
參考文獻/
第5章大數據處理與分析技術/
5.1大數據計算框架概述/
5.2文本數據處理與分析/
5.3圖像數據處理與分析/
5.4音頻數據處理與分析/
5.5視頻數據處理與分析/
參考文獻/
第6章大數據決策支持/
6.1大數據決策概述/
6.2可視化分析方法/
6.3機器學習方法/
6.4計量經濟學方法/
參考文獻/
第7章大數據應用研究案例/
7.1大數據機器學習研究案例/
7.2大數據計量模型研究案例/
參考文獻/
第8章大數據決策支持實驗/
8.1大數據機器學習實驗/
8.2大數據計量經濟分析實驗/
參考文獻/