《大數(shù)據(jù)挖掘與機器學(xué)習(xí):工業(yè)4.0時代重塑商業(yè)價值》分為3個部分,共17章。第Ⅰ部分“計算環(huán)境”,包括第1章到第3章。第Ⅱ部分“將數(shù)據(jù)轉(zhuǎn)化為商業(yè)價值”,包括第4章到第10章。這一部分聚焦于數(shù)據(jù)挖掘活動中所要用到的方法、算法和路徑。第Ⅲ部分“將其全部結(jié)合起來的成功案例”包括第11章到第17章。本部分主要描述了作者參與過的成功應(yīng)用大數(shù)據(jù)分析優(yōu)化企業(yè)決策、提高企業(yè)價值的公司案例。
《大數(shù)據(jù)挖掘與機器學(xué)習(xí):工業(yè)4.0時代重塑商業(yè)價值》可作為企業(yè)管理人員、營銷主管、分析人員、IT人員等作為理解大數(shù)據(jù)、應(yīng)用大數(shù)據(jù)為企業(yè)創(chuàng)造價值的指引,同時,本書也可供統(tǒng)計學(xué)、應(yīng)用數(shù)學(xué)及計算機專業(yè)學(xué)者和研究人員參考學(xué)習(xí)。
在今天的商業(yè)環(huán)境中,無窮無盡的大數(shù)據(jù)潮流經(jīng)常影響著重要的決策流程。為了保持和延續(xù)業(yè)務(wù)盈利,利用大數(shù)據(jù)的能力勢在必行。但是,只是獲得數(shù)據(jù)和具有處理能力并不足以得到有意義的結(jié)果。 《大數(shù)據(jù)挖掘與機器學(xué)習(xí)》為市場營銷主管、商業(yè)領(lǐng)袖和技術(shù)專家提供一套綜合手段,使其能開發(fā)出不斷產(chǎn)生有效結(jié)果并提高利潤率的戰(zhàn)略和方法,并且能將這些戰(zhàn)略和方法貫徹實施下去。在本書中,Jared Dean對大數(shù)據(jù)分析現(xiàn)狀以及日益提升的高性能計算體系結(jié)構(gòu)的趨勢進行深入淺出的回顧。《大數(shù)據(jù)挖掘與機器學(xué)習(xí)》明確地展示了如何利用大數(shù)據(jù)分析促進積極改變并且驅(qū)動效率。 Jared Dean循序漸進地揭示了如何應(yīng)用技術(shù)創(chuàng)建數(shù)據(jù)挖掘、機器學(xué)習(xí)及大數(shù)據(jù)處理的分析環(huán)境。該作者還探索權(quán)衡了不同技術(shù)選擇的結(jié)果。《大數(shù)據(jù)挖掘與機器學(xué)習(xí)》囊括了能夠加以應(yīng)用從被挖掘的數(shù)據(jù)中獲取信息的算法和方法,并提供了對如何有效地應(yīng)用這些方法的解釋。本書還提供了許多案例研究的說明,給出了許多已經(jīng)成功應(yīng)用了新的技術(shù)和算法來建立其競爭優(yōu)勢的組織的例子。作者還對預(yù)測建模和如何應(yīng)用這些工具于決策流程進行了討論。 對任何希望獲得數(shù)據(jù)分析能力的組織,這本重要的書都可以作為理解大數(shù)據(jù)基本技術(shù)和大數(shù)據(jù)分析的關(guān)鍵指引。現(xiàn)在你可以充滿自信地掌控你所在組織的大數(shù)據(jù)分析,創(chuàng)造出能夠一擊即中的結(jié)果。
Jared Dean(杰瑞德·迪安)是SAS研究院的研發(fā)高級總監(jiān)。他負責(zé)SAS全球數(shù)據(jù)挖掘解決方案的開發(fā)。這包括客戶互動、新功能開發(fā)、技術(shù)支持、銷售支持和產(chǎn)品集成。在加入SAS之前,Dean是美國人口調(diào)查局的數(shù)學(xué)統(tǒng)計學(xué)家。
1 概述
大數(shù)據(jù)大事年表
為何這個主題現(xiàn)在很重要
大數(shù)據(jù)是否只是一時的狂熱?
在何處應(yīng)用大數(shù)據(jù)會產(chǎn)生重大影響?
21 第Ⅰ部分 計算環(huán)境
23 第1章 硬件
1.1 存儲器(磁盤)
1.2 中央處理器
1.3 內(nèi)存
1.4 網(wǎng)絡(luò)
31 第2章 分布式系統(tǒng)
2.1 數(shù)據(jù)庫計算
2.2 文件系統(tǒng)計算
2.3 考慮因素
37 第3章 分析工具
3.1 Weka
3.2 Java和JVM語音
3.3 R語言
3.4 Python
3.5 SAS
47 第Ⅱ部分 將數(shù)據(jù)轉(zhuǎn)化為商業(yè)價值
49 第4章 預(yù)測建模
4.1 一個建模方法
4.2 sEMMA
4.3 二元分類法
4.4 多層分類法
4.5 區(qū)間預(yù)測
4.6 預(yù)測模型評估
63 第5章 一般預(yù)測建模技術(shù)
5.1 RFM
5.2 回歸
5.3 廣義線性模型
5.4 神經(jīng)網(wǎng)絡(luò)
5.5 決策樹和回歸樹
5.6 支持向量機
5.7 貝葉斯網(wǎng)絡(luò)分類方法
5.8 組合方法
117 第6章 細分
6.1 聚類分析
6.2 距離測度(指標(biāo))
6.3 聚類評估
6.4 聚類數(shù)量
6.5 K-means算法
6.6 分層聚類法
6.7 群特征刻畫
129 第7章 增量響應(yīng)建模
7.1 建立響應(yīng)模型
7.2 評估增量響應(yīng)
137 第8章 時間序列數(shù)據(jù)挖掘
8.1 降維
8.2 探查模式
8.3 時間序列數(shù)據(jù)挖掘的應(yīng)用:Nike+Fuelband智能手環(huán)
149 第9章 推薦系統(tǒng)
9.1 何為推薦系統(tǒng)?
9.2 應(yīng)用于何處?
9.3 如何起作用?
9.4 推薦質(zhì)量評估
9.5 推薦系統(tǒng)的應(yīng)用:SAS 圖書館
161 第10章 文本分析
10.1 信息檢索
10.2 內(nèi)容分類
10.3 文本挖掘
10.4 文本分析應(yīng)用:讓我們來玩《危險邊緣》(Jeopardy!)
177 第Ⅲ部分 將其全都結(jié)合起來的成功案例
179 第11章 基于某大型美國金融服務(wù)公司的案例研究
11.1 傳統(tǒng)市場營銷活動流程
11.2 高效的營銷解決方案
11.3 變革的價值主張
187 第12章 主要衛(wèi)生保健提供者的案例研究
12.1 CAHPS
12.2 HEDIS
12.3 HOS
12.4 IRE
197 第13章 技術(shù)制造商案例研究
13.1 發(fā)現(xiàn)設(shè)備缺陷
13.2 如何降低成本
201 第14章 在線品牌管理的案例研究
205 第15章 移動應(yīng)用推薦的案例研究
209 第16章 高科技產(chǎn)品制造商的案例研究
16.1 處理缺失數(shù)據(jù)
16.2 超越生產(chǎn)的應(yīng)用
213 第17章 展望未來
17.1 重復(fù)性研究
17.2 隱私與公共數(shù)據(jù)集
17.3 物聯(lián)網(wǎng)
17.4 未來的軟件開發(fā)
17.5 未來算法開發(fā)
17.6 總結(jié)
221 關(guān)于作者
223 附錄
225 參考文獻
231 譯者后記