本書作為《大數據導論》(ISBN 9787302500704)的配套實訓教材,旨在幫助讀者夯實基礎知識,還原企業真實業務,提升實操能力。本書從大數據開發所需要的基礎編程知識出發,首先闡述 Linux 開發環境中常用的命令。接著介紹數據清洗工具 Kettle 的基礎操作以及常見的數據可視化效果,如餅圖、柱狀圖、折線圖、平行坐標圖等。最后通過數據清洗、數據可視化、數據挖掘等熱門大數據技術在環境、金融、電商等行業的具體應用,給讀者提供真實的大數據體驗情景。
本書提供了豐富的項目實訓案例,結合實際情況進行真實的行業數據研究,從而培養實用型人才的專業項目能力。本書既可作為培養應用型人才的課程教材,也可作為相關開發人員的自學教材和參考手冊。