大數據：從基礎理論到最佳實踐

定價：¥59.8

中教價：¥29.90 (5.00折）

庫存數： 0

購買數量：

本書側重于大數據的實踐性技術，系統地介紹了主流大數據平臺及工具的安裝部署、管理維護和應用開發。平臺和工具的選擇均為當前業界主流的開源產品，因此，對于讀者來說，有很強的可操作性。

本書涉及的開源技術包括：HDFS、MapReduce、YARN、Zookeeper、HBase、Hive、Sqoop、Storm、Kafka、Flume等。除介紹一般性的背景知識、安裝部署、管理維護和應用開發技術外，還特別注重案例實踐，重要的技術點以實際工作場景或案例為依托，使讀者能快速入門，參考案例動手實踐，通過具體深入的實踐，體會大數據的技術本質特征，領略大數據技術帶來的創新理念，更好地理解和把握信息技術的發展趨勢。

本書主要內容包括以下幾大部分。

大數據存儲篇：以HDFS為基礎，介紹分布式文件系統的原理、安裝、fs命令的使用、編程，介紹如何用HDFS實現，并通過HTTP調用。

大數據計算篇：以MapReduce、YARN為基礎，介紹分布式計算的原理、部署，以及編程案例。

非關系型數據庫篇：以HBase為基礎，重點介紹非關系型數據庫的優勢、原理、部署，以及命令行使用，編程案例，與Sqoop配合使用等。

大數據倉庫篇：以Hive、數據倉庫等為基礎，重點介紹數據的抽取、原理、部署、分析與編程。

大數據實時計算篇：以Storm、Kafka為基礎，介紹實時計算的架構、組成、使用與開發。

本書非常適合從事大數據技術開發與使用的初學者，以及從事大數據技術研發的企事業單位工程師學習和參考，也適合高校計算機相關專業的專科生、本科生和研究生學習使用。

前言

　　技術革命的浪潮推動著人類文明的發展。

　　第一次浪潮造就了農業革命，它在數千年前出現并持續了數千年；第二次浪潮造就了工業革命，它在數百年前出現并持續了數百年；我們今天正在經歷著信息技術第三次浪潮，發端于數十年前，目前也只是處在初級階段。

　　農業技術革命釋放了"物之力"；工業技術革命釋放了"能之力"，而今天的信息技術革命釋放的是"智之力"。

　　距今400年前，培根在《偉大的復興》中預言：知識就是力量。今天，人類終于迎來"知識經濟時代"，它是人類社會經濟增長方式與經濟發展的全新模式。

　　人類認識物質世界、人類社會和精神世界的最高境界是智慧，而要達智慧的境界，必然要跨越數據、信息、知識三個層級。

　　數據作為基礎，是信息之母、知識之初、智慧之源。正是今天的大數據技術，引燃了人們實現智慧城市、智慧醫療、智慧教育等有關人工智慧的激情。人們真切地認識到，對于人工智能，只要讓數據發生質變，即使是簡單的數據，也比復雜的算法更有效。

　　今天，移動互聯網的發展，使我們在獲取數據上有了質的飛躍，人類的各種社會活動都與互聯網這個虛擬世界相聯系，使全樣本、全過程地有效測量和記錄成為可能，構建了生成大數據生態的土壤，同時，人們還在期待和憧憬物聯網帶來更大的沖擊。

　　另一方面，云計算發展到今天，不論從技術到產業都開始進入成熟期，這也是大數據發展的基石和推進器。

　　在今天這個時代中，運用大數據洞見事物蘊藏的"智慧"成為人們的渴望。大數據更新了人們對數據的認識。在技術層面，小數據時代的很多數據處理方法和工具已不再有效，需要一系列新的方法和工具。所幸，有大量平民化的開源軟件可用，它們不需要特殊的硬件系統，也更適用于云計算環境。

　　本書正是一本介紹主流的大數據開源軟件平臺和工具的技術專著，側重于大數據的實踐性技術，幫助讀者快速入門，通過具體深入的實踐，體會大數據的技術本質特征，領略大數據技術帶來的創新理念，更好地理解和把握信息技術的發展趨勢。

本書定位

　　(1) 信息發展已步入大數據時代，當前對于大數據還缺乏面向公眾的技術實踐手冊。

　　(2) 本書的創作團隊有豐富的大數據規劃、開發、運營等經驗，多位作者成功地架構了教育部、科技部、互聯網等大數據架構與分析項目。

　　(3) 本書的參與者均是部委信息一線工程師、著名外企架構師、國內企業資深高級工程師，所做的理論分析易于學習，實踐具有可操作性。

　　(4) 本書重點介紹大數據的基礎理論、關鍵技術，以及編程實踐。利用本書，就可以完全搭建并能有效地管理好大數據平臺。

本書特色

　　(1) 理念先進：均是國內外最新的大數據理念；方便讀者全面了解國內外大數據研究與發展的情況。

　　(2) 技術領先：參與者均是國內IT人士；采用的平臺均是業界主流開源平臺，涉及大數據常用的HDFS、MapReduce、YARN、Zookeeper、HBase、Hive、Sqoop、Storm、Kafka等技術的介紹與編程使用。

　　(3) 案例豐富：提供翔實的實例與解決方法，供項目中參考。

　　(4) 資源齊備：本書涉及的配套下載資源可以從清華大學出版社的網站中下載。

全書關鍵字

　　大數據、分布式計算、數據倉庫、數據分析、HDFS、MapReduce、YARN、Zookeeper、HBase、Hive、Sqoop、Storm、Kafka。

　　由于編者的水平有限，書中難免有疏漏和錯誤，希望業內專家和廣大讀者指正。

　　編者

祁偉：畢業于北京師范大學，目前擔任《中國教育信息化》雜志社總編輯，具有超過20年的IT工作經驗，在網絡路由、服務器虛擬化、數據庫等方面有深入研究和豐富的實踐經驗。

劉冰：畢業于中國科學院計算技術研究所，數據中心架構師，從事虛擬化、監測與大數據分析等方面研究，曾與祁偉總編共同著有《云計算：從基礎架構到*實踐》，現就職于教育部教育管理信息中心。

常志軍：畢業于中國科學院自動化研究所，大數據平臺架構師，分布式系統研究人員。先后在搜狐暢游、中國搜索、Opera歐朋、中科院自動化所從事大數據領域的探索與研發工作。

趙廷濤：畢業于中國傳媒大學，現就職于科技部信息中心，有多年大數據存儲研發經驗，現從事數據中心管理運維工作，專注于虛擬化、應用系統建設等相關技術研究。

高俊秀：畢業于北京航空航天大學計算機學院，數據倉庫架構師，八年互聯網大數據從業經驗。歷任百度、豌豆莢、今日頭條的數據平臺和數據倉庫核心研發和負責人，對數據在業務上發揮價值有深入的理解。

国产91青青成人a在线/在线视频成人/aaa成人永久在线观看视频/深夜草莓视频app

目錄

国产91青青成人a在线/在线视频成人/aaa成人永久在线观看视频/深夜草莓视频app

目 錄

目錄