午夜精品久久久久久久久,亚洲午夜电影一区二区三区,色综合图区

Spark內(nèi)核設(shè)計的藝術(shù)：架構(gòu)設(shè)計與實現(xiàn)

定價：¥139

中教價：¥104.25 (7.50折）

庫存數(shù)： 0

叢書名：大數(shù)據(jù)技術(shù)叢書

購買數(shù)量：

    全書分為10章。第1章介紹Spark學(xué)習(xí)環(huán)境的搭建。第2章介紹Spark的基本知識和架構(gòu)。第3章介紹Spark內(nèi)核底層的基礎(chǔ)設(shè)施。第4章介紹SparkContext的初始化。第5章介紹Spark執(zhí)行環(huán)境SparkEnv。第6章介紹Spark自身的存儲體系。本章不同于其他書籍將存儲的各個組件視為不同內(nèi)容，而是將存儲體系的內(nèi)容凝聚起來。第7章介紹Spark的調(diào)度系統(tǒng)。第8章介紹Spark的計算引擎。第9章介紹Spark的部署模式。第10章介紹Spark的API。Spark從表面上看與之前版本大的不同是API，所以本章拿個別API的實現(xiàn)作為例子，分析其源碼實現(xiàn)，讓讀者理解新老API之間的異同。

　　Preface前言為什么寫這本書給本書寫前言時，讓我想起了兩年前給《深入理解Spark：核心思想與源碼分析》一書寫前言的經(jīng)歷。我不禁想起崔護的《題都城南莊》這首詩，詩的內(nèi)容是：

　　去年今日此門中，人面桃花相映紅。

　　人面不知何處去，桃花依舊笑春風(fēng)。

　　從核心思想和架構(gòu)來看，Spark依然是那個Spark，但是我已經(jīng)找了一個新的“東家”。我的年齡不知不覺中又長了兩歲，Spark也在大數(shù)據(jù)領(lǐng)域從“新貴”變成了“老人”。Spark的版本從0.x.x到2.x.x基本上也是用了兩年時間。

　　自從《深入理解Spark：核心思想與源碼分析》一書出版后，引起了一些市場反響，更難得的是得到了很多讀者的反饋。一些熱心的讀者通過微信或者郵件向我指出了書中內(nèi)容的很多不足之處，包括錯別字、錯誤的描述、代碼分析有點像流水賬、提綱挈領(lǐng)的內(nèi)容偏少、代碼版本過低等。一些錯誤在修訂的版本中得到了解決，有些修正的內(nèi)容則通過單獨寫博客來補充。在與讀者的溝通過程中，也糾正了我對一些問題的理解偏差。再次深深地感謝廣大讀者的支持與幫助！

　　一些讀者對《深入理解Spark：核心思想與源碼分析》一書的內(nèi)容非常肯定，希望能夠出第2版，高婧雅編輯也一再“慫恿”我，但是我一直沒有寫第2版的打算。我當時希望有人能夠以更好的方式寫一本介紹和分析Spark 2.0版本的源碼分析書籍，因為我感覺之前的寫作方式的確不是很好。在我心中一直有個矛盾：如果源碼太少，源碼分析的書籍將退化成單純講原理的書籍，對于想深入理解Spark實現(xiàn)的讀者來說這是不夠的；如果源碼太多，又讓人有堆砌代碼或者“混”篇幅的感覺。很多源碼分析的書只是簡單說說接口或者方法的功能，讓人始終有種“霧里看花”的感覺。所以我一直很期待能有更好的方式來寫作源碼分析類的書。

　　在一年多的等待中，我始終沒有發(fā)現(xiàn)類似書籍的出現(xiàn)，于是我打算再做一次嘗試。這次擯棄了《深入理解Spark：核心思想與源碼分析》一書中按照代碼執(zhí)行流程分析的方式，改為先從整體上介紹一個系統(tǒng)，然后逐個分析每個組件的功能，最后將這些組件之間的關(guān)系用流程圖的方式串聯(lián)起來。本書的寫作方式依然犯有代碼過多的“毛病”，但我還是期待本書能帶來一些新的氣象。

　　本書的主要特色按照源碼分析的習(xí)慣設(shè)計，從腳本分析到初始化，再到核心內(nèi)容。整個過程遵循由淺入深的基本思路。

　　每一章先對本章的內(nèi)容有個總體介紹，然后深入分析各個組件的實現(xiàn)原理，最后將各個組件之間的關(guān)系通過執(zhí)行流程來展現(xiàn)。

　　本書盡可能地用圖來展示原理，以加速讀者對內(nèi)容的掌握。

　　本書講解的很多實現(xiàn)及原理都值得借鑒，可以幫助讀者提升架構(gòu)設(shè)計、程序設(shè)計等方面的能力。

　　本書盡可能保留較多的源碼，以便于初學(xué)者能夠在脫離辦公環(huán)境的地方（如地鐵、公交等），也能輕松閱讀。

　　讀者對象源碼閱讀是一項苦差事，人力和時間成本都很高，尤其對于剛剛接觸Spark的人來說更是如此。本書盡可能保留源碼，使得分析過程不至于產(chǎn)生跳躍感，目的是降低大多數(shù)人的學(xué)習(xí)門檻。如果你是從事IT工作1～3年的新人或者希望開始學(xué)習(xí)Spark的核心知識，本書非常適合你。如果你已經(jīng)對Spark有所了解或者已經(jīng)使用它，還想進一步提高自己，那么本書更適合你。如果你是一個開發(fā)新手，對Java、Linux等基礎(chǔ)知識還不是很了解的話，本書可能不太適合你。如果你已經(jīng)對Spark有深入的研究，本書也許可以作為你的參考資料。

　　總體來說，本書適合以下人群：

　　已經(jīng)了解過Spark，但還想深入理解Spark實現(xiàn)原理的人；大數(shù)據(jù)技術(shù)愛好者；對性能優(yōu)化和部署方案感興趣的運維工程師與架構(gòu)師；開源代碼愛好者，喜歡研究源碼的同學(xué)可以通過本書學(xué)到一些閱讀源碼的方式、方法。

　　本書不會教你如何開發(fā)Spark應(yīng)用程序，而只拿word count的經(jīng)典例子做演示。本書會簡單介紹Hadoop MapReduce、Hadoop YARN、Mesos、Alluxio（Tachyon）、ZooKeeper、HDFS、Akka、Jetty、Netty，但不會過多介紹這些框架的使用，因為市場上已經(jīng)有豐富的書籍供讀者挑選。本書也不會過多介紹Scala、Java、Shell的語法，讀者可以在市場上選擇適合自己的書籍閱讀。本書將無比適合那些想要破解“潘多拉魔盒”的人！

　　如何閱讀本書本書一共有10章內(nèi)容，主要包括以下部分。

　　準備部分（第1～2章）：簡單介紹了Spark的環(huán)境搭建和基本原理，幫助讀者了解一些背景知識。

　　基礎(chǔ)部分（第3～5章）：介紹Spark的基礎(chǔ)設(shè)施、SparkContext的初始化、Spark執(zhí)行環(huán)境等內(nèi)容。

　　核心部分（第6～9章）：這是Spark最為核心的部分，包括存儲體系、調(diào)度系統(tǒng)、計算引擎、部署模式等。

　　API部分（第10章）：這部分主要對Spark的新舊API進行對比，對新API進行介紹。

　　本書最后的附錄中還包括一些內(nèi)容：附錄A介紹的是Spark中最常用的工具類Utils；附錄B是Akka的簡介；附錄C為Jetty的簡介和工具類JettyUtils的介紹；附錄D為Metrics庫的簡介和Metrics中部分API的介紹；附錄E演示了Hadoop 1.0版本中的word count例子；附錄F

　　耿嘉安，藝龍大數(shù)據(jù)平臺架構(gòu)師，前阿里巴巴高級開發(fā)工程師，11年開發(fā)經(jīng)驗，對Spark有深入研究，精通大數(shù)據(jù)業(yè)務(wù)、Java架構(gòu)設(shè)計，擅長J2EE，有9年Java相關(guān)開發(fā)經(jīng)驗，關(guān)注Spark、Storm、ODPS。

目錄  Contents
本書贊譽
前言
第1章　環(huán)境準備 1
1.1　運行環(huán)境準備 2
1.1.1　安裝JDK 2
1.1.2　安裝Scala 2
1.1.3　安裝Spark 3
1.2　Spark初體驗 4
1.2.1　運行spark-shell 4
1.2.2　執(zhí)行word count 5
1.2.3　剖析spark-shell 9
1.3　閱讀環(huán)境準備 14
1.3.1　安裝SBT 15
1.3.2　安裝Git 15
1.3.3　安裝Eclipse Scala IDE插件 15
1.4　Spark源碼編譯與調(diào)試 17
1.5　小結(jié) 23
第2章　設(shè)計理念與基本架構(gòu) 24
2.1　初識Spark 25
2.1.1　Hadoop MRv1的局限25
2.1.2　Spark的特點 26
2.1.3 Spark使用場景 28
2.2　Spark基礎(chǔ)知識 29
2.3　Spark基本設(shè)計思想 31
2.3.1　Spark模塊設(shè)計 32
2.3.2　Spark模型設(shè)計 34
2.4　Spark基本架構(gòu) 36
2.5　小結(jié) 38
第3章　Spark基礎(chǔ)設(shè)施 39
3.1　Spark配置 40
3.1.1　系統(tǒng)屬性中的配置 40
3.1.2　使用SparkConf配置的API 41
3.1.3　克隆SparkConf配置 42
3.2　Spark內(nèi)置RPC框架 42
3.2.1　RPC配置TransportConf 45
3.2.2　RPC客戶端工廠Transport- ClientFactory 47
3.2.3　RPC服務(wù)端TransportServer 53
3.2.4　管道初始化 56
3.2.5　TransportChannelHandler詳解 57
3.2.6　服務(wù)端RpcHandler詳解 63
3.2.7　服務(wù)端引導(dǎo)程序Transport-ServerBootstrap 68
3.2.8　客戶端TransportClient詳解 71
3.3　事件總線 78
3.3.1　ListenerBus的繼承體系 79
3.3.2　SparkListenerBus詳解 80
3.3.3　LiveListenerBus詳解 83
3.4　度量系統(tǒng) 87
3.4.1　Source繼承體系 87
3.4.2　Sink繼承體系 89
3.5　小結(jié) 92
第4章　SparkContext的初始化 93
4.1　SparkContext概述 94
4.2　創(chuàng)建Spark環(huán)境 97
4.3　SparkUI的實現(xiàn) 100
4.3.1　SparkUI概述 100
4.3.2　WebUI框架體系 102
4.3.3　創(chuàng)建SparkUI 107
4.4　創(chuàng)建心跳接收器 111
4.5　創(chuàng)建和啟動調(diào)度系統(tǒng)112
4.6　初始化塊管理器BlockManager 114
4.7　啟動度量系統(tǒng) 114
4.8　創(chuàng)建事件日志監(jiān)聽器115
4.9　創(chuàng)建和啟動ExecutorAllocation-Manager 116
4.10　ContextCleaner的創(chuàng)建與啟動 120
4.10.1　創(chuàng)建ContextCleaner 120
4.10.2　啟動ContextCleaner 120
4.11　額外的SparkListener與啟動事件總線 122
4.12　Spark環(huán)境更新 123
4.13　SparkContext初始化的收尾 127
4.14　SparkContext提供的常用方法 128
4.15　SparkContext的伴生對象130
4.16　小結(jié) 131
第5章　Spark執(zhí)行環(huán)境 132
5.1　SparkEnv概述 133
5.2　安全管理器SecurityManager 133
5.3　RPC環(huán)境 135
5.3.1　RPC端點RpcEndpoint 136
5.3.2　RPC端點引用RpcEndpointRef 139
5.3.3　創(chuàng)建傳輸上下文TransportConf 142
5.3.4　消息調(diào)度器Dispatcher 142
5.3.5　創(chuàng)建傳輸上下文Transport-Context 154
5.3.6　創(chuàng)建傳輸客戶端工廠Transport-ClientFactory 159
5.3.7　創(chuàng)建TransportServer 160
5.3.8　客戶端請求發(fā)送 162
5.3.9　NettyRpcEnv中的常用方法 173
5.4　序列化管理器SerializerManager 175
5.5　廣播管理器BroadcastManager 178
5.6　map任務(wù)輸出跟蹤器 185
5.6.1　MapOutputTracker的實現(xiàn) 187
5.6.2　MapOutputTrackerMaster的實現(xiàn)原理 191
5.7　構(gòu)建存儲體系 199
5.8　創(chuàng)建度量系統(tǒng) 201
5.8.1　MetricsCon?g詳解 203
5.8.2　MetricsSystem中的常用方法 207
5.8.3　啟動MetricsSystem 209
5.9　輸出提交協(xié)調(diào)器 211
5.9.1　OutputCommitCoordinator-Endpoint的實現(xiàn) 211
5.9.2　OutputCommitCoordinator的實現(xiàn) 212
5.9.3　OutputCommitCoordinator的工作原理 216
5.10　創(chuàng)建SparkEnv 217
5.11　小結(jié) 217
第6章　存儲體系 219
6.1　存儲體系概述 220
6.1.1　存儲體系架構(gòu) 220
6.1.2　基本概念 222
6.2　Block信息管理器 227
6.2.1　Block鎖的基本概念 227
6.2.2　Block鎖的實現(xiàn) 229
6.3　磁盤Block管理器 234
6.3.1　本地目錄結(jié)構(gòu) 234
6.3.2　DiskBlockManager提供的方法 236
6.4　磁盤存儲DiskStore 239
6.5　內(nèi)存管理器 242
6.5.1　內(nèi)存池模型 243
6.5.2　StorageMemoryPool詳解 244
6.5.3　MemoryManager模型 247
6.5.4　Uni?edMemoryManager詳解 250
6.6　內(nèi)存存儲MemoryStore 252
6.6.1　MemoryStore的內(nèi)存模型 253
6.6.2　MemoryStore提供的方法 255
6.7　塊管理器BlockManager 265
6.7.1　BlockManager的初始化 265
6.7.2　BlockManager提供的方法 266
6.8　BlockManagerMaster對Block-Manager的管理 285
6.8.1　BlockManagerMaster的職責(zé) 285
6.8.2　BlockManagerMasterEndpoint詳解 286
6.8.3　BlockManagerSlaveEndpoint詳解 289
6.9　Block傳輸服務(wù) 290
6.9.1　初始化NettyBlockTransfer-Service 291
6.9.2　NettyBlockRpcServer詳解 292
6.9.3　Shuf?e客戶端 296
6.10　DiskBlockObjectWriter詳解 305
6.11　小結(jié) 308
第7章　調(diào)度系統(tǒng) 309
7.1　調(diào)度系統(tǒng)概述 310
7.2　RDD詳解 312
7.2.1　為什么需要RDD 312
7.2.2　RDD

你還可能感興趣

我要評論

您的姓名	驗證碼：
留言內(nèi)容

国产91青青成人a在线/在线视频成人/aaa成人永久在线观看视频/深夜草莓视频app