全書共有12章,從Hadoop起源開始,介紹了Hadoop的安裝和配置,并對Hadoop的組件分別進行了介紹,包括HDFS分布式存儲系統,MapReduce計算框架,海量數據庫HBase,Hive數據倉庫,Pig、ZooKeeper管理系統等知識,最后對Hadoop實時數據處理技術作了簡單介紹,旨在讓讀者了解當前的其它的大數據處理技術。本書除了對Hadoop的理論進行說明之外,還對如何使用各組件進行了介紹,但介紹的只是基礎的使用,沒有涉及到底層的高級內容,所以本書只是起一個引導作用,旨在讓讀者了解Hadoop并能夠使用Hadoop的基本功能,并不是學習Hadoop的完全手冊。本書適用于高等院校的學生;是云計算專業、物聯網專業及云計算與大數據專業的核心基礎課程,也是計算機相關專業的一門新增專業課或選修課;適合于零售及云計算與大數據技術相關的培訓班等使用。
熱門技術院校關注市場空白專家團隊廣泛調研內容基礎循序漸進資源豐富本書的體系結構及內容做了精心的設計,實現理論指導實踐、實踐提升理論的良性循環。按照“模塊理論-模塊實踐”這一思路進行編排,通過不斷地螺旋迭代逐漸讓學生掌握Hadoop的體系架構及各組件的功能及相應典型案例。在內容編寫方面,注意難點分散、循序漸進;在實例選取方面,注意實用性強、針對性強。
安俊秀,女,教授,西安交通大學攻讀計算機科學與技術專業,獲工學碩士學位。中國計算機學會高級會員;中國電子學會高級會員;成都市科技攻關計劃評審專家;成都軍區項目評審專家;汕尾市科技顧問團首席顧問。
在科研工作方面,一直從事云計算與大數據、信息智能搜索與計算社會方面的研究工作。近五年來就此發表論文40余篇,其中**作者20余篇,核心期刊以上占15余篇。主編或參與完成專著3部、教材4部,6部由***出版社出版。獲得國家發明專利2項(2014授權),實用新型專利授權12項。獲得軟件著作權13項。科研項目20項,其中作為項目負責人承擔省部級項目3項;作為主研人員參與***項目6項、省級項目6項。