本書是企業業務數據分析方法的集大成著作,由知名數據分析研究機構CDA 數據科學研究院組織多名行業知名專家進行研討、策劃、編著而成。書中內容源自對各行業領軍企業實際業務數據分析技能需求的提煉及總結,這些企業包括但不限于京東、阿里巴巴、騰訊、百度、德勤、畢馬威、IBM、微軟、GrowingIO 等。全書由八大部分構成:緒論、表格結構數據與表結構數據、數據庫應用、描述性統計分析、多維數據透視分析、業務分析方法、業務分析報告與數據可視化報表、CDA 職業發展。
CDA數據科學研究院簡介2013年,大數據行業方興未艾,CDA數據科學研究院孕育而生,是國內率先成立的專注于數據科學領域的專業研究團隊。CDA數據科學研究院匯集數據行業專家,團隊具有專業的學術素養、精湛的研究水平、扎實的企業實戰經驗,豐富的行業資源,通過對各類企業、社會組織等進行全面、系統、深入的調查和訪問,從而獲得緊跟技術發展的經驗與數據,并結合數據行業的未來發展方向進行系統的研究,不斷研發新的知識體系和技術應用。近十年來,CDA數據科學研究院秉持“專業性、前沿性、科學性”的定位,深耕數據分析、大數據、人工智能等核心領域,持續推進數據科學的行業發展。未來,CDA數據科學研究院也將順應數字化時代浪潮,持續開拓創新,繼續加大數據科學領域的內容建設,推進人才數字化賦能,助力企業數字化轉型。
目錄
第1 章 緒論. 1
1.1 數據分析概述 .1
1.1.1 數據分析的分類 .3
1.1.2 數據分析的基本流程 .4
1.1.3 數據分析的落地方法 .7
1.2 數據分析師概述 .8
1.2.1 數據分析師的不同角色與職責 .8
1.2.2 數據分析師職業道德和行為準則 .10
1.3 數據相關的安全與立法 13
1.3.1 各國的數據隱私相關法律 .13
1.3.2 我國大數據立法的歷程和展望 .14
1.4 本章練習題 16
第2 章 表格結構數據與表結構數據. 18
2.1 表格結構數據 .19
2.1.1 表格結構數據概述 .19
2.1.2 表格結構數據特征 .20
2.2 表格結構數據的獲取、引用與使用 .24
2.2.1 表格結構數據的獲取 .24
2.2.2 表格結構數據的引用、查詢與計算方法 .28
2.3 表結構數據 38
2.3.1 表結構數據概述 .38
2.3.2 表結構數據特征 .40
2.4 表結構數據的獲取、加工與使用 45
2.4.1 表結構數據的獲取 .45
2.4.2 數據庫與商業智能的概念解析 .46
2.4.3 表結構數據的合并 .54
2.4.4 表結構數據的匯總 .60
2.5 本章練習題 65
第3 章 數據庫應用. 71
3.1 數據庫相關概念 71
3.1.1 數據庫簡介 71
3.1.2 認識數據庫 .74
3.1.3 SQL .76
3.1.4 數據倉庫 .77
3.2 數據定義語言 .79
3.2.1 DDL 在業務中的作用 .80
3.2.2 定義數據庫 .80
3.2.3 數據表 .82
3.2.4 數據類型 .88
3.2.5 約束條件 .92
3.3 數據操作語言 .100
3.3.1 DML 的作用 .100
3.3.2 添加數據 .100
3.3.3 將查詢結果添加到表中 .102
3.3.4 更新數據 .103
3.3.5 刪除數據 .104
3.4 數據查詢語言 .104
3.4.1 單表查詢 .105
3.4.2 函數 .125
3.4.3 多表查詢 .142
3.4.4 子查詢 .158
3.5 視圖 168
3.5.1 視圖的作用 .168
3.5.2 創建視圖 .169
3.5.3 修改視圖 .169
3.5.4 刪除視圖 .170
3.6 本章練習題 170
第4 章 描述性統計分析. 181
4.1 統計學概述 181
4.1.1 統計學的定義及應用 .181
4.1.2 統計學的基本概念 .185
4.2 數據的描述性統計分析 192
4.2.1 集中趨勢的描述 .192
4.2.2 離散程度的描述 .203
4.2.3 分布形態的描述 .208
4.2.4 描述性統計圖表 .211
4.3 常用的數據分布 .218
4.3.1 兩點分布與二項分布 .219
4.3.2 正態分布與標準正態分布 .221
4.3.3 c2 分布 .228
4.3.4 t 分布.229
4.3.5 F 分布 .230
4.3.6 分位點的概念 .232
4.4 相關分析 233
4.4.1 相關分析的含義 .233
4.4.2 簡單線性相關關系的描述 .234
4.4.3 簡單線性相關關系的度量 .235
4.5 本章練習題 239
第5 章 多維數據透視分析 246
5.1 多維數據模型 .246
5.1.1 多維數據模型概述 .247
5.1.2 多維數據模型創建方法 .248
5.2 5W2H 思維模型 .261
5.2.1 5W2H 思維模型概述 .261
5.2.2 5W2H 思維模型應用案例 262
5.3 多維數據透視分析應用案例 .265
5.3.1 業務場景介紹 .265
5.3.2 案例設計制作過程 .265
5.4 本章練習題 267
第6 章 業務分析方法 274
6.1 業務指標分析 .274
6.1.1 通用指標計算方法 .276
6.1.2 場景指標 .286
6.1.3 指標體系 .302
6.2 業務模型分析 .307
6.2.1 分類模型 .308
6.2.2 漏斗模型 .312
6.3 業務分析方法論 .318
6.3.1 帕累托分析方法 .318
6.3.2 A/B 測試分析方法 .320
6.3.3 同期群分析方法 .320
6.3.4 因果分析方法 .321
6.4 本章練習題 322
第7 章 業務分析報告與數據可視化報表. 330
7.1 可視化分析圖表 .330
7.1.1 業務圖表決策樹 .330
7.1.2 比較類圖表 .331
7.1.3 序列類圖表 .338
7.1.4 構成類圖表 .339
7.1.5 描述類圖表 .340
7.2 業務分析報表 .340
7.2.1 業務分析報表的分類與區別 .341
7.2.2 業務分析報表的創建方法 .342
7.3 業務分析報告 345
7.3.1 業務分析報告的分類 .346
7.3.2 業務分析報告撰寫注意事項 .346
7.3.3 業務分析報告案例1 348
7.3.4 業務分析報告案例2 352
7.4 本章練習題 355
第8 章 CDA 職業發展 361
8.1 CDA 職業概述 361
8.1.1 CDA 職業背景 .361
8.1.2 CDA 職業特點 .362
8.1.3 CDA 職業前景 .363
8.2 CDA 認證簡介 364
8.2.1 CDA 認證標準 .364
8.2.2 CDA 認證方式 .365
8.2.3 CDA 認證流程 .366
8.2.4 CDA 認證證書 .367
8.3 CDA 持證人與會員 .368
8.3.1 成為CDA 會員 368
8.3.2 CDA 持證人權益 .369
8.3.3 年檢和繼續教育 .370
附錄A 數據類型列表 371
附錄B 練習題答案及解析. 374
附錄C 名詞解釋 393