數據可視化允許利用圖形、圖像處理、計算機視覺以及用戶界面,通過表達、建模以及對立體、表面、屬性以及動畫的顯示,對數據加以可視化解釋,數據可視化技術在國內市場長期看好,而現階段國內相關書籍相對較少,本書選擇這個方向進行系統基礎研究,希望為那些在想此領域有所發展的讀者提供學習幫助。在本書中,我們首先介紹數據可視化的一些基本知識,隨后重點介紹使用Tableau、SAS及SPSS Modeler的可視化界面進行數據分析與數據挖掘的方法。
序言
大數據時代正在變革著我們的生活、工作和思維,如何讓大數據發揮出最大價值,最重要的手段就是進行數據可視化挖掘。利用可視化數據挖掘工具和技術,分析人員能夠從全新的角度快速、輕松地挖掘信息,可視化數據挖掘使數據挖掘變得更簡單,建模過程不需要編寫代碼,非技術出身的業務人員等,可以更好地利用數據做出決策。
本書基于Tableau10.3和IBMSPSSModeler18.0編寫,詳細介紹了Tableau的數據連接、圖形編輯、創建地圖、表計算和聚合計算等功能,以及IBMSPSSModeler的數據連接、CRISP-DM(跨行業數據挖掘標準流程)等功能。通過6個實際案例,重點介紹了可視化數據挖掘技術在電信、電力、醫藥、銀行、電商和房地產等行業中的應用。
本書的內容
第1章介紹數據可視化和可視化數據挖掘的基本理論及其主要軟件,前者包括Tableau、QlikView和PowerBI,后者包括SPSSModeler、IntelligentMiner和SASEnterpriseMiner。
第2章介紹TableauDesktop10.3的軟件概括、數據類型、運算符及優先級、軟件的安裝與激活和Tableau的文件類型等。
第3章介紹TableauDesktop可以連接的數據源,包括Excel文件、文本文件、Access、JSON文件、PDF文件、空間文件和統計文件等,還介紹了如何連接各類數據庫,如TableauServer、SQLServer、MySQL、Oracle等。
第4章首先介紹TableauDesktop的維度和度量、連續和離散的概念和操作,然后介紹了工作區和工作表的等基礎操作,最后詳細介紹了表計算、創建字段、創建參數和聚合計算等高級操作。
第5章介紹如何使用Tableau生成一些統計圖形,如條形圖、餅圖、直方圖、折線圖、散點圖、并排圖、甘特圖等,重點介紹了如何使用Tableau創建地圖,包括設置角色、比較地圖、添加字段信息、設置地圖選項、創建分布圖和自定義地圖等。
第6章介紹IBMSPSSModeler的發展歷史、軟件特點、軟件算法、軟件功能、安裝過程和授權許可等。
第7章介紹使用IBMSPSSModeler進行數據挖掘的6個基本步驟:業務理解、數據理解、數據準備、建立模型、評估模型和應用模型。
第8章介紹IBMSPSSModeler的一些基本操作,包括連接到文件和連接到數據庫,前者包括Excel文件、SAS文件、SPSSStatistics文件、變量文件和固定文件等,后者包括Oracle、SQLServer、DB2、MySQL等數據庫。
第9章介紹IBMSPSSModeler的數據流操作,包括生成數據流、添加和刪除節點、連接數據流、修改連接節點和執行數據流等。
第10章介紹可視化數據挖掘在電信行業中的應用,根據客戶流失數據,運用Logistic回歸算法,建立了基于客戶屬性、服務屬性和客戶消費信息的客戶流失預警模型。
第11章介紹可視化數據挖掘在電力行業中的應用,由于用電負荷具有季節性和周期性的特點,因此運用時間序列模型,同時我們選擇時間序列中的專家建模器進行建模。
第12章介紹可視化數據挖掘在醫藥行業中的應用,根據患者的用藥數據,應用K-Means聚類算法,建立了基于藥物在人體的類膽固醇TC、Na、Ka等因素的藥物效果聚類模型。
第13章介紹可視化數據挖掘在銀行業中的應用,根據客戶流失數據,運用判別分析模型,建立了基于客戶的屬性數據、信用等級和資產狀況等因素的客戶類型判別模型。
第14章介紹可視化數據挖掘在電商行業中的應用,根據客戶流失數據,運用神經網絡模型,建立了基于促銷費用、促銷前的銷售額和促銷后的銷售額等因素的促銷效果評價模型。
第15章介紹可視化數據挖掘在房地產行業中的應用,根據客戶流失數據,運用CHAID決策樹算法,建立了基于年齡、性別、學歷、月薪和家庭人數等因素的購房決策樹模型。
本書的特色
。1)內容全面,講解詳細
本書是一本實踐性的可視化數據挖掘著作,詳細介紹了常用軟件,對于初次學習可視化數據挖掘的讀者來說幫助較大,書中列出了每一步操作,便于讀者的練習實踐。
。2)由淺入深、循序漸進
本書從Tableau和IBMSPSSModeler的簡介、連接數據源、基礎操作到高級操作,逐步深入,從易到難,由淺入深,循序漸進,適合可視化數據挖掘各個層次的讀者閱讀。
。3)案例豐富,高效學習
本書在介紹數據可視化和數據挖掘軟件后,為了使讀者快速提高數據分析的整體能力,結合6個實際案例對可視化數據挖掘的流程及步驟進行了詳細全面的介紹。
本書的讀者對象
本書的內容和案例適用于互聯網、銀行證券、電商、醫藥等行業數據分析用戶進行可視化數據挖掘,可供高等院校相關專業學生以及從事可視化數據挖掘的研究者參考使用,也可作為Tableau和IBMSPSSModeler軟件培訓和自學的教材。
由于編者水平所限,書中難免存在錯誤和不妥之處,請廣大讀者批評指正。
編者
2017年9月
收起全部↑
王國平,大數據分析師,具體工作經歷如下:2011-2014 上海大智慧股份有限公司 數據研究員2014-2016 中國電信上海分公司 大數據分析師2016至今 上海博轅信息技術服務有限公司 數據分析師