Spark大數據分析
作 者:劉景澤
價 格:89.00
出 版 社:電子工業出版社
出版時間:2019年07月
字 數:
開(kāi) 本:16開(kāi)
I S B N :9787121370519
所屬分類:暢銷圖書
内容簡介
本書基于Spark 2.3.x、Spark 2.4.x系列版本采用“理論 實踐”的形式編寫。全書共有90個實例,1個完整項目。
第1篇“準備”,包括認識大數據和Spark、安裝與配置Spark集群、第1個Spark程序;
第2篇“入門”,包括讀寫分布式數據、處理分布式數據;
第3篇“進(jìn)階”,包括RDD的高級操作、用SQL語法分析結構化數據、實時處理流式數據;
第4篇“高階”,包括實時處理流式數據、Spark的相關優化;
第5篇“商業項目實戰”,用Spark的各種(zhǒng)組件實現一個學(xué)生學(xué)情分析商業項目。
本書結構清晰、實例豐富、通俗易懂、實用性強,特别适合Spark的初學(xué)者和進(jìn)階讀者作爲自學(xué)用書。另外,本書也适合社會培訓學(xué)校作爲培訓教材,還(hái)适合大中專院校的相關專業作爲教學(xué)參考書。