本書全面系統(tǒng)地介紹了大數(shù)據(jù)的相關(guān)技術(shù)原理與應(yīng)用方法。全書從理論知識入手,在介紹大數(shù)據(jù)相關(guān)理論知識的基礎(chǔ)上,逐步深入地講解大數(shù)據(jù)技術(shù),將理論與實踐完美結(jié)合。本書分為大數(shù)據(jù)基礎(chǔ)篇、大數(shù)據(jù)存儲篇、大數(shù)據(jù)采集篇、大數(shù)據(jù)計算篇和大數(shù)據(jù)應(yīng)用篇。全書共15章,內(nèi)容包括大數(shù)據(jù)概述、Linux集群搭建、分布式文件系統(tǒng)HDFS、HDFS的安裝與基本應(yīng)用、分布式數(shù)據(jù)庫系統(tǒng)HBase、HBase的安裝與基本應(yīng)用、Sqoop和Flume、數(shù)據(jù)分發(fā)工具Kafka、MapReduce計算框架與應(yīng)用、基于內(nèi)存的計算框架Spark、Spark的安裝與應(yīng)用、機器學(xué)習(xí)、基于Hive的交互式數(shù)據(jù)處理、數(shù)據(jù)同步工具與數(shù)據(jù)可視化和推薦算法與應(yīng)用。本書在介紹Hadoop、HBase、Sqoop和Flume、MapReduce、Hive和Spark等相關(guān)章節(jié)時安排了入門級實驗,且以電子資源的方式提供給學(xué)生,以便讀者更好地學(xué)習(xí)和掌握大數(shù)據(jù)的關(guān)鍵技術(shù)。
本書可以作為高等院校計算機類、信息管理與信息系統(tǒng)等相關(guān)專業(yè)的大數(shù)據(jù)課程教材,也可供從事大數(shù)據(jù)技術(shù)開發(fā)、研究和應(yīng)用的研究人員和工程技術(shù)人員參考。
1.緊跟時代發(fā)展,內(nèi)容更加完善。注重新技術(shù)、新方法的介紹。
2.將大數(shù)據(jù)基礎(chǔ)理論與實踐相結(jié)合的教材。從初學(xué)者角度出發(fā),以輕量級理論、豐富實例相結(jié)合的方式介紹大數(shù)據(jù)常用的各種工具和技術(shù)。
3.配套資源豐富。教學(xué)大綱、實驗大綱、教學(xué)課件、案例源代碼。
蔣亞平,男,湖南長沙人,長期從事大數(shù)據(jù)技術(shù)、數(shù)據(jù)庫技術(shù)、程序設(shè)計語言和算法方面的研究,能夠熟練運用多種教學(xué)方法,特別是翻轉(zhuǎn)課堂、案例式教學(xué)、啟發(fā)式教學(xué)等。從事8年企業(yè)開發(fā)工作和8年教學(xué)經(jīng)驗,對大數(shù)據(jù)課程教學(xué)有一定的積累,并多次參加大數(shù)據(jù)相關(guān)的教改、科研、教學(xué)競賽和指導(dǎo)學(xué)生參加比賽。