前言
第1章 大數(shù)據(jù)概述
1.1 大數(shù)據(jù)定義
1.1.1 初識(shí)大數(shù)據(jù)
1.1.2 大數(shù)據(jù)的特征
1.1.3 大數(shù)據(jù)技術(shù)
1.2 大數(shù)據(jù)的結(jié)構(gòu)類型
1.2.1 結(jié)構(gòu)化數(shù)據(jù)
1.2.2 半結(jié)構(gòu)化數(shù)據(jù)
1.2.3 非結(jié)構(gòu)化數(shù)據(jù)
1.2.4 其他分類方式下的數(shù)據(jù)類型
1.3 大數(shù)據(jù)發(fā)展
1.3.1 大數(shù)據(jù)概念發(fā)展
1.3.2 大數(shù)據(jù)浪潮下數(shù)據(jù)存儲(chǔ)的發(fā)展
1.4 大數(shù)據(jù)應(yīng)用及挑戰(zhàn)
1.4.1 大數(shù)據(jù)應(yīng)用
1.4.2 大數(shù)據(jù)發(fā)展面臨的挑戰(zhàn)
本章小結(jié)
思考題
第2章 大數(shù)據(jù)采集
2.1 大數(shù)據(jù)來源
2.2 大數(shù)據(jù)采集設(shè)備
2.2.1 科研數(shù)據(jù)采集設(shè)備
2.2.2 網(wǎng)絡(luò)數(shù)據(jù)采集設(shè)備
2.3 大數(shù)據(jù)采集方法
2.3.1 科研大數(shù)據(jù)采集方法
2.3.2 網(wǎng)絡(luò)大數(shù)據(jù)采集方法
2.3.3 系統(tǒng)日志采集方法
2.4 大數(shù)據(jù)預(yù)處理技術(shù)
2.4.1 數(shù)據(jù)預(yù)處理技術(shù)基本概述
2.4.2 數(shù)據(jù)清理
2.4.3 數(shù)據(jù)集成
2.4.4 數(shù)據(jù)變換與數(shù)據(jù)離散化
本章小結(jié)
思考題
第3章 大數(shù)據(jù)存儲(chǔ)
3.1 云存儲(chǔ)
3.1.1 云存儲(chǔ)簡介
3.1.2 云存儲(chǔ)技術(shù)
3.2 大數(shù)據(jù)存儲(chǔ)
3.2.1 大數(shù)據(jù)存儲(chǔ)的特點(diǎn)與挑戰(zhàn)
3.2.2 存儲(chǔ)系統(tǒng)架構(gòu)
3.2.3 新興數(shù)據(jù)庫技術(shù)
3.3 數(shù)據(jù)中心
3.3.1 數(shù)據(jù)中心概述
3.3.2 數(shù)據(jù)中心的演進(jìn)
3.3.3 數(shù)據(jù)中心的分級(jí)
3.3.4 數(shù)據(jù)中心的體系結(jié)構(gòu)
3.4 數(shù)據(jù)倉庫
3.4.1 數(shù)據(jù)倉庫的基本概念
3.4.2 數(shù)據(jù)倉庫的體系結(jié)構(gòu)
本章小結(jié)
思考題
第4章 大數(shù)據(jù)計(jì)算平臺(tái)
4.1 云計(jì)算
4.1.1 云計(jì)算定義
4.1.2 云計(jì)算特點(diǎn)
4.1.3 云計(jì)算體系架構(gòu)
4.1.4 云計(jì)算與相關(guān)計(jì)算形式
4.1.5 云計(jì)算的機(jī)遇與挑戰(zhàn)
4.2 云計(jì)算平臺(tái)
4.2.1 主流分布式計(jì)算系統(tǒng)
4.2.2 主流分布式計(jì)算平臺(tái)
4.3 MapReduce平臺(tái)
4.3.1 數(shù)據(jù)存儲(chǔ)技術(shù)
4.3.2 數(shù)據(jù)管理技術(shù)
4.3.3 編程模型
4.4 Hadoop平臺(tái)
4.4.1 Hadoop概述
4.4.2 Hadoop結(jié)構(gòu)
4.4.3 Hadoop分布式文件系統(tǒng)HDFS
4.4.4 Hadoop中的M印Reduce
……
第5章 大數(shù)據(jù)分析
第6章 大數(shù)據(jù)挖掘
第7章 大數(shù)據(jù)下的機(jī)器學(xué)習(xí)算法
第8章 大數(shù)據(jù)可視化
第9章 社會(huì)大數(shù)據(jù)
第10章 交通大數(shù)據(jù)
第11章 醫(yī)療大數(shù)據(jù)
第12章 金融大數(shù)據(jù)
第13章 大數(shù)據(jù)教育