大數據導論
定 價:¥49.8
中 教 價:¥38.35 (7.70折)
庫 存 數: 0
前 言
基 礎 篇
第1 章 緒論 3
1.1 概述 3
1.1.1 數據 4
1.1.2 數據中蘊含的價值 6
1.1.3 獲取數據中蘊含的價值 8
1.2 大數據的內涵和外延 9
1.2.1 大數據時代的驅動力 9
1.2.2 大數據的概念和特征 10
1.2.3 大數據帶來的思維模式改變 12
1.2.4 大數據的作用和意義 13
1.3 大數據的技術挑戰和科學意義 15
1.3.1 數據處理的一般過程 16
1.3.2 大數據計算面臨的挑戰 17
1.3.3 大數據計算的特點 18
1.3.4 大數據計算平臺 19
1.3.5 大數據與云計算;人工智能的關系 20
1.4 數據科學 22
1.4.1 數據科學的提出 23
1.4.2 數據科學的范疇 23
1.4.3 數據科學對學科發展的影響 24
習題 25
參考文獻及擴展閱讀資料 26
技 術 篇
第2 章 數據采集與治理 29
2.1 概述 30
2.2 大數據的來源與多源數據的采集方式 30
2.2.1 大數據的來源 30
2.2.2 多源數據的采集 31
2.2.3 數據離散化 33
2.3 數據集成和跨界應用的數據集成方法 34
2.3.1 數據集成的定義與形式 34
2.3.2 傳統數據集成 35
2.3.3 跨界數據集成 38
2.4 數據的預處理 40
2.4.1 數據變換 40
2.4.2 數據質量的檢驗與提升 41
習題 44
參考文獻及擴展閱讀資料 44
第3 章 數據管理 46
3.1 概述 46
3.2 關系數據庫 47
3.2.1 關系數據模型 48
3.2.2 結構化查詢語言 51
3.2.3 數據庫事務 52
3.2.4 關系數據庫管理系統 53
3.3 分布式文件系統 54
3.3.1 Hadoop 55
3.3.2 Ceph 57
3.3.3 GlusterFS 59
3.3.4 分布式文件系統對比 60
3.4 新型數據管理與查詢系統 61
3.4.1 NoSQL 數據庫 61
3.4.2 SQL on Hadoop 系統 65
......