本書(shū)通過(guò)詳細(xì)的示例、樣本數(shù)據(jù)集、代碼和圖形教程,說(shuō)明了如何:1為每個(gè)問(wèn)題使用合適類(lèi)型的圖2快速、高效且正確地收集、清洗和組織數(shù)據(jù)3為高可讀性設(shè)置可視化格式,而不損失精確性4掌握允許更深入地探索和解釋數(shù)據(jù)的工具5使用少量輕量級(jí)編程創(chuàng)建自定義可視化6選擇有效的圖分析技術(shù)來(lái)從數(shù)據(jù)中提取出最多信息7使用高級(jí)的可視化技術(shù),包括動(dòng)態(tài)圖、大數(shù)據(jù)工具和查詢(xún)。
作 者 簡(jiǎn) 介Richard Brath是數(shù)據(jù)可視化的積極實(shí)踐者和先行者,其視覺(jué)分析的研究、設(shè)計(jì)與開(kāi)發(fā)不僅涉及研究領(lǐng)域還用于商業(yè)領(lǐng)域。他創(chuàng)建的解決方案范圍很廣,從用于移動(dòng)設(shè)備中豐富的交互式可視化,到用于商業(yè)應(yīng)用的多點(diǎn)觸控、多屏幕裝置以及基于Web的可視化分析,涉及的應(yīng)用領(lǐng)域也很廣,如貿(mào)易、職業(yè)體育和廣播電視等,每天都有成千上萬(wàn)的人使用。 David Jonker是Uncharted(原來(lái)的Oculus Info Inc)公司的聯(lián)合創(chuàng)始人和高級(jí)合伙人。他是一名設(shè)計(jì)師和開(kāi)發(fā)人員,為基于Web的、分布式的、移動(dòng)的應(yīng)用設(shè)計(jì)可視化分析工具和平臺(tái)。他在過(guò)去20多年做了大量可視化工作,其中包括位于時(shí)代廣場(chǎng)NASDAQ MarketSite實(shí)時(shí)廣播中心的可視化系統(tǒng)。目前,他是DARPA XDATA項(xiàng)目的帶頭人。Jonker和Brath是商業(yè)合作伙伴,兩個(gè)人也經(jīng)常在領(lǐng)先的行業(yè)及研究論壇上發(fā)表演講,進(jìn)行展示。 技術(shù)編輯簡(jiǎn)介Scott Langevin是Uncharted的一位主管和研究人員,擁有超過(guò)12年的行業(yè)和學(xué)術(shù)界經(jīng)驗(yàn)。他在南卡羅來(lái)納大學(xué)獲得了計(jì)算機(jī)科學(xué)的博士學(xué)位,方向是機(jī)器學(xué)習(xí)、面向服務(wù)計(jì)算和軟件工程。Langevin的研究興趣包括概率圖建模、大規(guī)模可視化分析和適應(yīng)性用戶(hù)界面。 Peter MacMurchy是擁有超過(guò)15年經(jīng)驗(yàn)的專(zhuān)業(yè)軟件開(kāi)發(fā)人員,他關(guān)注UX、UI和交互式數(shù)據(jù)可視化工具。在卡爾加里大學(xué)讀計(jì)算機(jī)科學(xué)學(xué)位研究計(jì)算機(jī)圖形學(xué)時(shí),課程作業(yè)激發(fā)了他對(duì)信息可視化的強(qiáng)烈興趣。自那之后,他就一直為金融、電影、能源等行業(yè)開(kāi)發(fā)可視化和交互軟件。
目 錄
前言
作者簡(jiǎn)介
第I部分 概述
第1章 為什么使用圖 2
1.1 商業(yè)中的可視化 3
1.2 商業(yè)中的圖 4
1.2.1 找出反常現(xiàn)象 5
1.2.2 管理網(wǎng)絡(luò)和供應(yīng)鏈 7
1.2.3 辨別風(fēng)險(xiǎn)模式 9
1.2.4 優(yōu)化資產(chǎn)組合 11
1.2.5 繪制社會(huì)等級(jí)分層圖 13
1.2.6 發(fā)現(xiàn)社區(qū) 15
1.3 圖的現(xiàn)狀 16
1.4 小結(jié) 17
第2章 圖的類(lèi)型及其適用的問(wèn)題 18
2.1 關(guān)系 18
2.2 分層 21
2.3 社區(qū) 23
2.4 流 27
2.5 空間網(wǎng)絡(luò) 30
2.6 小結(jié) 32
第Ⅱ部分 過(guò)程和工具
第3章 數(shù)據(jù):收集、清洗和連接 35
3.1 了解目標(biāo) 35
3.2 收集:識(shí)別數(shù)據(jù) 35
3.2.1 潛在的圖數(shù)據(jù)源 36
3.2.2 潛在的分層數(shù)據(jù)源 41
3.2.3 獲取數(shù)據(jù) 43
3.3 清洗:準(zhǔn)備數(shù)據(jù) 44
3.4 連接:組織圖數(shù)據(jù) 45
3.4.1 計(jì)算圖 46
3.4.2 圖數(shù)據(jù)的文件格式 48
3.5 集中回顧 54
3.6 小結(jié) 54
第4章 統(tǒng)計(jì)數(shù)據(jù)和布局 55
4.1 基本的圖統(tǒng)計(jì)數(shù)據(jù) 55
4.1.1 大小(節(jié)點(diǎn)數(shù)和邊數(shù)) 55
4.1.2 密度 56
4.1.3 成分?jǐn)?shù) 56
4.1.4 度和路徑 56
4.1.5 中心度 58
4.1.6 病毒式營(yíng)銷(xiāo)示例 59
4.2 布局 60
4.2.1 節(jié)點(diǎn)–連接布局 60
4.2.2 其他布局 61
4.2.3 力導(dǎo)向布局 62
4.2.4 僅節(jié)點(diǎn)布局 66
4.2.5 時(shí)間布局 67
4.2.6 自頂向下和其他正交分層 68
4.2.7 輻射狀分層 71
4.2.8 地理布局和地圖 72
4.2.9 弦圖 74
4.2.10 鄰接矩陣 74
4.2.11 樹(shù)圖 76
4.2.12 分層餅圖 76
4.2.13 平行坐標(biāo) 77
4.3 集中回顧 79
4.4 小結(jié) 79
第5章 視覺(jué)特性 80
5.1 基本視覺(jué)特性 81
5.2 關(guān)鍵的節(jié)點(diǎn)特性 82
5.2.1 節(jié)點(diǎn)大小 82
5.2.2 節(jié)點(diǎn)顏色 84
5.2.3 標(biāo)簽 87
5.3 關(guān)鍵的邊特性 91
5.3.1 邊的權(quán)重 91
5.3.2 邊的顏色 91
5.3.3 邊的類(lèi)型 92
5.4 組合基本特性 93
5.5 捆綁、形狀、圖片及更多 94
5.5.1 捆綁邊 94
5.5.2 形狀 95
5.5.3 節(jié)點(diǎn)圖片 95
5.5.4 節(jié)點(diǎn)邊框 96
5.5.5 更多特性 97
5.5.6 干擾與分隔 97
5.6 集中回顧 101
5.7 小結(jié) 101
第6章 探索和解釋 102
6.1 探索、解釋和導(dǎo)出 102
6.2 必要的探索性交互 104
6.2.1 縮放和搖動(dòng)(以及比例縮放和旋轉(zhuǎn)) 105
6.2.2 識(shí)別 106
6.2.3 過(guò)濾器 107
6.2.4 隔離和重做布局 109
6.3 更多交互式探索 110
6.3.1 識(shí)別鄰近節(jié)點(diǎn) 111
6.3.2 路徑 111
6.3.3 刪除 112
6.3.4 分組 112
6.3.5 迭代分析 114
6.4 解釋 114
6.4.1 數(shù)據(jù)故事的順序 115
6.4.2 圖例 116
6.4.3 注釋 116
6.4.4 導(dǎo)出數(shù)據(jù)子集、圖和圖片 118
6.5 集中回顧 119
6.6 小結(jié) 120
第7章 鼠標(biāo)點(diǎn)擊類(lèi)圖工具 121
7.1 Excel 121
7.1.1 匯總連接 122
7.1.2 提取節(jié)點(diǎn) 122
7.1.3 Excel中的鄰接矩陣可視化 123
7.2 NodeXL 125
7.2.1 NodeXL基礎(chǔ) 125
7.2.2 社交網(wǎng)絡(luò)功能 127
7.3 Gephi 129
7.3.1 Gephi基礎(chǔ) 129
7.3.2 注意事項(xiàng) 131
7.4 Cytoscape 133
7.4.1 Cytoscape基礎(chǔ) 133
7.4.2 將數(shù)據(jù)導(dǎo)入Cytoscape 134
7.4.3 視覺(jué)特性 135
7.4.4 Apps菜單 139
7.5 yEd 139
7.6 小結(jié) 141
第8章 輕量級(jí)編程 143
8.1 Python 143
8.1.1 上手 143
8.1.2 清洗數(shù)據(jù) 144
8.1.3 從連接數(shù)據(jù)集中提取節(jié)點(diǎn)集合 145
8.1.4 將電子郵件數(shù)據(jù)轉(zhuǎn)換為圖 149
8.1.5 圖數(shù)據(jù)庫(kù) 154
8.2 JavaScript與圖的可視化 155
8.2.1 D3基礎(chǔ) 155
8.2.2 D3和圖 160
8.2.3 D3彈簧圖 169
8.3 小結(jié) 174
第Ⅲ部分 圖的可視化分析
第9章 關(guān)系 176
9.1 連接和關(guān)系 176
9.1.1 詐騙索賠中的相似性 177
9.1.2 網(wǎng)絡(luò)安全 179
9.2 電子郵件關(guān)系 181
空間分隔 181
9.3 演員與電影 184
9.4 將連接轉(zhuǎn)換為節(jié)點(diǎn) 186
9.5 小結(jié) 188
第10章 分層 189
10.1 組織結(jié)構(gòu)圖 189
10.2 樹(shù)與圖 191
10.3 繪制分層 193
10.4 決策樹(shù) 198
10.5 網(wǎng)站樹(shù)及有效性 200
10.6 小結(jié) 203
第11章 社區(qū) 204
11.1 社區(qū)的定義特征 205
11.2 圖聚類(lèi) 205
11.2.1 社交網(wǎng)絡(luò)案例分析 206
11.2.2 使用NodeXL和Gephi分析社交媒體 206
11.2.3 可聚類(lèi)的布局 208
11.2.4 使用顏色描述簇的特征 210
11.2.5 社區(qū)發(fā)現(xiàn) 211
11.2.6 使用顏色來(lái)區(qū)分簇 212
11.2.7 社區(qū)話(huà)題分析 214
11.2.8 社區(qū)情感 216
11.3 團(tuán)伙和其他組 219
11.3.1 社交媒體中的團(tuán)伙 220
11.3.2 使用凸包的社區(qū)組 220
11.4 小結(jié) 223
第12章 流 224
12.1 桑基圖 225
12.2 構(gòu)造一個(gè)桑基圖 229
12.2.1 創(chuàng)建頁(yè)面結(jié)構(gòu) 229
12.2.2 處理和建模數(shù)據(jù) 230
12.2.3 可視化數(shù)據(jù) 231
12.2.4 高亮顯示通過(guò)節(jié)點(diǎn)的流 233
12.3 使用流的社區(qū)布局 235
12.4 弦圖 237
12.5 構(gòu)造一個(gè)弦圖 238
12.5.1 準(zhǔn)備數(shù)據(jù) 238
12.5.2 創(chuàng)建頁(yè)面結(jié)構(gòu) 239
12.5.3 處理和建模數(shù)據(jù) 240
12.5.4 可視化數(shù)據(jù) 243
12.5.5 根據(jù)需要顯示交互細(xì)節(jié) 247
12.6 行為因子樹(shù) 248
12.7 小結(jié) 249
第13章 空間網(wǎng)絡(luò) 250
13.1 示意圖布局 250
13.2 小世界分組 255
13.3 連接玫瑰匯總 255
13.4 路線(xiàn)模式 263
13.4.1 可視化路線(xiàn)段 264
13.4.2 軌跡聚合 267
13.5 小結(jié) 268
第IV部分 高級(jí)技術(shù)
第14章 大數(shù)據(jù) 270
14.1 圖數(shù)據(jù)庫(kù) 271
14.1.1 產(chǎn)品營(yíng)銷(xiāo)示例 271
14.1.2 創(chuàng)建和填充一個(gè)圖數(shù)據(jù)庫(kù) 273
14.2 圖查詢(xún)語(yǔ)言 275
14.2.1 使用Gremlin進(jìn)行圖查詢(xún) 276
14.2.2 使用圖查詢(xún)來(lái)提取鄰域 278
14.3 分析鄰域 281
14.4 繪制網(wǎng)絡(luò)活動(dòng) 287
14.5 社區(qū)可視化 289
14.6 小結(jié) 290
第15章 動(dòng)態(tài)圖 291
15.1 圖的變化 291
15.1.1 有機(jī)動(dòng)畫(huà) 292
15.1.2 完整時(shí)間跨度布局 293
15.1.3 重影 295
15.1.4 淡出 296
15.1.5 社區(qū)演化 297
15.2 交易圖 298
15.2.1 聚類(lèi)交易分析 299
15.2.2 空間交易分析 304
15.3 小結(jié) 305
第16章 設(shè)計(jì) 307
16.1 節(jié)點(diǎn) 307
16.1.1 節(jié)點(diǎn)的形狀 308
16.1.2 節(jié)點(diǎn)大小 313
16.1.3 節(jié)點(diǎn)標(biāo)簽 314
16.2 連接 314
16.3 顏色 318
16.4 小結(jié) 320
圖論術(shù)語(yǔ)表 322