主要內容包括,大數據技術概述(或背景知識),Scala基礎知識,Spark基礎,RDD編程,Spark SQL開發,Spark Streaming / Structured Streaming編程,MLLib 機器學習編程等基礎內容。
主要作為本科生數據科學與大數據技術、計算機科學與技術等相關專業必修或選修課程教科書,或作為相關工程技術人員的參考書。
本教材基于Spark 3.3.x等新版本所帶來的開發方式、方法的變化,從工業、服務業等行業實際應用開發的角度,介紹Spark開發的基礎知識,開發過程中的注意事項,并提供合理建議,從而引導學習過程更貼近大數據開發實際。
除了不同于其他教材所講解的內容基礎未基于新的軟件產品或平臺外,本教程更是從工業、服務行業大數據開發實際需求出發,引導學習者養成良好的開發習慣,為高效率地解決實際問題打開堅實基礎。