圖分析與圖機(jī)器學(xué)習(xí):原理、算法與實(shí)踐 [美]維克多·李 [荷]阮福堅(jiān) [美]亞歷山大·托馬斯
定 價(jià):¥89
中 教 價(jià):¥53.40 (6.00折)
庫(kù) 存 數(shù): 37
本書(shū)的目標(biāo)是向你介紹圖數(shù)據(jù)結(jié)構(gòu)、圖分析和圖機(jī)器學(xué)習(xí)的概念、技術(shù)和工具。每章的開(kāi)頭都列出了目標(biāo),大致分為三個(gè)方面:學(xué)習(xí)圖分析和機(jī)器學(xué)習(xí)的概念;用圖分析解決特定問(wèn)題;了解如何使用GSQL查詢(xún)語(yǔ)言和TigerGraph圖平臺(tái)。首先介紹圖數(shù)據(jù)的基本概念,然后通過(guò)連接、分析、學(xué)習(xí)三大部分深入講解一些圖算法和機(jī)器學(xué)習(xí)技術(shù)。
隨著圖形數(shù)據(jù)庫(kù)的迅速崛起,企業(yè)正在實(shí)施高級(jí)分析和機(jī)器學(xué)習(xí)解決方案,以幫助推動(dòng)業(yè)務(wù)成果。本實(shí)用指南向數(shù)據(jù)科學(xué)家、數(shù)據(jù)工程師、架構(gòu)師和業(yè)務(wù)分析師展示了如何使用領(lǐng)先的圖形數(shù)據(jù)庫(kù)模型TigerGraph開(kāi)始使用圖形數(shù)據(jù)庫(kù)。你將探索從互聯(lián)數(shù)據(jù)中獲取價(jià)值的三階段方法:連接、分析和學(xué)習(xí)。三位作者介紹了涵蓋多種當(dāng)代業(yè)務(wù)需求的真實(shí)使用案例。通過(guò)使用TigerGraph Cloud進(jìn)行實(shí)踐練習(xí),你將很快熟練掌握為企業(yè)設(shè)計(jì)和管理高級(jí)分析和機(jī)器學(xué)習(xí)解決方案的方法。
前言
目標(biāo)本書(shū)的目標(biāo)是向你介紹圖數(shù)據(jù)結(jié)構(gòu)、圖分析和圖機(jī)器學(xué)習(xí)的概念、技術(shù)和工具。當(dāng)你讀 完這本書(shū)時(shí),我們希望你能理解如何使用圖分析來(lái)解決一系列現(xiàn)實(shí)世界的問(wèn)題。我們希 望你能夠回答以下問(wèn)題:圖是否適合任務(wù)?應(yīng)該使用哪些工具和技術(shù)?數(shù)據(jù)中有哪些有 意義的關(guān)系,應(yīng)該如何根據(jù)關(guān)系分析來(lái)制定任務(wù)?根據(jù)經(jīng)驗(yàn),我們發(fā)現(xiàn)許多人能夠快速掌握?qǐng)D的一般概念和結(jié)構(gòu),但要思考圖,要培 養(yǎng)如何最佳地將數(shù)據(jù)建模為圖的直覺(jué),然后將分析型任務(wù)制定為圖查詢(xún),則需要更多 的努力和經(jīng)驗(yàn)。幾乎每章的開(kāi)頭都列出了對(duì)應(yīng)的目標(biāo),它們大致分為三個(gè)方面:學(xué)習(xí) 圖分析和機(jī)器學(xué)習(xí)的概念;用圖分析解決特定問(wèn)題;了解如何使用 GSQL 查詢(xún)語(yǔ)言和 TigerGraph 圖平臺(tái)。目標(biāo)讀者和前提條件本書(shū)的目標(biāo)讀者是對(duì)數(shù)據(jù)分析感興趣并想學(xué)習(xí)圖分析的人。你不必是一位嚴(yán)肅的程序員 或數(shù)據(jù)科學(xué)家,但了解一些數(shù)據(jù)庫(kù)和編程的概念肯定有助于你理解本書(shū)內(nèi)容。當(dāng)我們深 入講解一些圖算法和機(jī)器學(xué)習(xí)技術(shù)時(shí),我們會(huì)給出一些涉及集合、求和與極限的數(shù)學(xué)方 程式。這些方程式只是本書(shū)文字和圖像的補(bǔ)充。在本書(shū)的案例部分,我們將在 TigerGraph Cloud 平臺(tái)上運(yùn)行預(yù)先編寫(xiě)好的 GSQL 代碼。 你只需要一臺(tái)可以訪問(wèn)互聯(lián)網(wǎng)的計(jì)算機(jī)即可。如果你熟悉 SQL 數(shù)據(jù)庫(kù)查詢(xún)語(yǔ)言和任意主 流編程語(yǔ)言,那么你將能夠理解大部分的 GSQL 代碼。如果你不熟悉它們,也可以簡(jiǎn)單 地按照說(shuō)明并跟隨書(shū)中的注釋來(lái)運(yùn)行預(yù)先編寫(xiě)的案例示例。
閱讀方法和路線我們旨在以實(shí)際的數(shù)據(jù)分析需求(而不是理論原理)為導(dǎo)向來(lái)呈現(xiàn)內(nèi)容。我們會(huì)嘗試使 用最簡(jiǎn)單的術(shù)語(yǔ)來(lái)解釋事情,并盡量使用日常概念而不是難懂的技術(shù)術(shù)語(yǔ)。本書(shū)通過(guò)完整的示例來(lái)介紹 GSQL 語(yǔ)言。在本書(shū)開(kāi)頭,我們逐行描述了每行示例代碼的 目的和功能。我們還對(duì)特別重要的語(yǔ)言結(jié)構(gòu)、語(yǔ)法和語(yǔ)義進(jìn)行了強(qiáng)調(diào)。若要獲得更全面 的 GSQL 教程,可以參閱本書(shū)之外的其他資源。
Victor Lee是TigerGraph機(jī)器學(xué)習(xí)和人工智能副總裁。他的博士論文是關(guān)于基于圖的相似性和排序的。Lee博士與他人合作撰寫(xiě)了關(guān)于決策樹(shù)和密集子圖發(fā)現(xiàn)的書(shū)籍章節(jié)。 教學(xué)和培訓(xùn)也是他職業(yè)生涯的核心工作,從開(kāi)發(fā)芯片設(shè)計(jì)培訓(xùn)材料到撰寫(xiě)TigerGraph的第1版技術(shù)文檔,從擔(dān)任12年課堂講師到主持大量網(wǎng)絡(luò)研討會(huì)和現(xiàn)場(chǎng)研討會(huì),他都參與其中。Phuc Kien Nguyen是荷蘭銀行反洗錢(qián)和恐怖主義融資領(lǐng)域的數(shù)據(jù)科學(xué)家。他擁有代爾夫特理工大學(xué)的信息架構(gòu)碩士學(xué)位。Alexander Thomas是前TigerGraph技術(shù)作家,擁有語(yǔ)言學(xué)和教育背景。
黃凱,碩士研究生,畢業(yè)于北京理工大學(xué),現(xiàn)任北京速通科技有限公司軟件研發(fā)中心總工程師,主要從事于高可用、高性能、高并發(fā)的后臺(tái)服務(wù)系統(tǒng)開(kāi)發(fā),對(duì)微服務(wù)架構(gòu)、容器技術(shù)有一定的研究,對(duì)底層應(yīng)用開(kāi)發(fā)具有較深的了解,主導(dǎo)研發(fā)了多個(gè)ETC相關(guān)系統(tǒng)。
目錄前言1第1章 連接就是一切71.1 連接改變一切81.1.1 什么是圖81.1.2 圖的重要性91.1.3 邊連接優(yōu)于表連接101.2 圖分析和機(jī)器學(xué)習(xí)131.3 本章小結(jié)14第一部分 連接第2章 連接并探索數(shù)據(jù)192.1 圖的結(jié)構(gòu)202.1.1 圖的術(shù)語(yǔ)202.1.2 圖的模式242.2 圖的遍歷262.2.1 跳數(shù)和距離262.2.2 廣度和深度272.3 圖的建模272.3.1 圖模式選項(xiàng)和權(quán)衡272.3.2 表格轉(zhuǎn)換為圖312.3.3 模型演進(jìn)332.4 圖的能力332.4.1 連接點(diǎn)342.4.2 360度視圖342.4.3 深入洞察352.4.4 尋找并發(fā)現(xiàn)模式372.4.5 匹配和合并382.4.6 加權(quán)和預(yù)測(cè)392.5 本章小結(jié)40第3章 更好地了解客戶(hù)和業(yè)務(wù):360圖423.1 案例1:跟蹤和分析客戶(hù)旅程423.2 解決方案:Customer 360 旅程圖433.3 實(shí)現(xiàn)C360 旅程圖:一個(gè)GraphStudio教程453.3.1 創(chuàng)建TigerGraph Cloud賬戶(hù)453.3.2 獲取并安裝Customer 360入門(mén)套件463.3.3 GraphStudio概述483.3.4 設(shè)計(jì)圖模式483.3.5 加載數(shù)據(jù)503.3.6 查詢(xún)和分析503.4 案例2:藥物不良反應(yīng)分析603.5 解決方案:藥物相互作用360圖603.6 實(shí)現(xiàn)613.6.1 圖模式613.6.2 查詢(xún)和分析623.7 本章小結(jié)69第4章 研究創(chuàng)業(yè)投資704.1 目標(biāo):找到有前途的創(chuàng)業(yè)公司704.2 解決方案:創(chuàng)業(yè)投資圖714.3 實(shí)現(xiàn)創(chuàng)業(yè)投資圖以及查詢(xún)724.3.1 Crunchbase入門(mén)套件724.3.2 圖模式724.3.3 查詢(xún)和分析744.4 本章小結(jié)88第5章 檢測(cè)欺詐和洗錢(qián)模式905.1 目標(biāo):檢測(cè)金融犯罪905.2 解決方案:將金融犯罪建模為網(wǎng)絡(luò)模式915.3 實(shí)施金融犯罪模式搜索925.3.1 欺詐和洗錢(qián)檢測(cè)入門(mén)套件925.3.2 圖模式925.3.3 查詢(xún)和分析935.4 本章小結(jié)102第二部分 分析第6章 深入洞察:分析連接的重要性1056.1 了解圖分析1056.1.1 分析要求1066.1.2 圖遍歷方法1066.1.3 并行處理1076.1.4 聚合1076.2 使用圖算法進(jìn)行分析1096.2.1 將圖算法作為工具1096.2.2 圖算法分類(lèi)1106.3 本章小結(jié)127第7章 更好的推薦和建議1287.1 案例1:改善醫(yī)療轉(zhuǎn)診1287.2 解決方案:構(gòu)建和分析轉(zhuǎn)診圖1297.3 實(shí)現(xiàn)醫(yī)療專(zhuān)家轉(zhuǎn)診網(wǎng)絡(luò)1297.3.1 醫(yī)療轉(zhuǎn)診網(wǎng)絡(luò)入門(mén)套件1297.3.2 圖模式1307.3.3 查詢(xún)和分析1317.4 案例2:個(gè)性化推薦1397.5 解決方案:使用圖進(jìn)行基于多關(guān)系的推薦1407.6 實(shí)現(xiàn)多關(guān)系推薦引擎1407.6.1 推薦引擎2.0入門(mén)套件1407.6.2 圖模式1407.6.3 查詢(xún)和分析1427.7 本章小結(jié)150第8章 加強(qiáng)網(wǎng)絡(luò)安全1518.1 網(wǎng)絡(luò)攻擊的代價(jià)1518.2 挑戰(zhàn)1528.3 解決方案1528.4 實(shí)現(xiàn)網(wǎng)絡(luò)安全圖1538.4.1 網(wǎng)絡(luò)安全威脅檢測(cè)入門(mén)套件1538.4.2 圖模式1538.4.3 查詢(xún)和分析1548.5 本章小結(jié)163第9章 航空公司航線分析1649.1 目標(biāo):分析航空公司航線1649.2 解決方案:航線網(wǎng)絡(luò)的圖算法1659.3 實(shí)現(xiàn)機(jī)場(chǎng)和航線分析器1659.3.1 圖算法入門(mén)套件1659.3.2 圖模式和數(shù)據(jù)集1659.3.3 安裝GDS庫(kù)中的算法1669.3.4 查詢(xún)和分析1679.4 本章小結(jié)178第三部分 學(xué)習(xí)第10章 圖驅(qū)動(dòng)的機(jī)器學(xué)習(xí)算法18110.1 基于圖算法的無(wú)監(jiān)督學(xué)習(xí)18210.1.1 通過(guò)相似性和社區(qū)結(jié)構(gòu)來(lái)學(xué)習(xí)18210.1.2 尋找頻繁模式18310.2 提取圖特征18410.2.1 領(lǐng)域無(wú)關(guān)特征18510.2.2 領(lǐng)域相關(guān)特征18810.2.3 圖嵌入:一個(gè)全新的世界19110.3 圖神經(jīng)網(wǎng)絡(luò)19910.3.1 圖卷積網(wǎng)絡(luò)19910.3.2 GraphSAGE20310.4 圖機(jī)器學(xué)習(xí)方法的比較20510.4.1 機(jī)器學(xué)習(xí)任務(wù)的用例20510.4.2 模式發(fā)現(xiàn)與特征提取方法20610.4.3 圖神經(jīng)網(wǎng)絡(luò):總結(jié)與應(yīng)用20710.5 本章小結(jié)207第11章 重新審視實(shí)體解析20811.1 問(wèn)題描述:識(shí)別現(xiàn)實(shí)世界的用戶(hù)及其品味20811.2 解決方案:基于圖的實(shí)體解析20911.2.1 確實(shí)哪些實(shí)體是相同的20911.2.2 實(shí)體解析21011.3 實(shí)現(xiàn)基于圖的實(shí)體解析21111.3.1 數(shù)據(jù)庫(kù)內(nèi)實(shí)體解析入門(mén)套件21111.3.2 圖模式21111.3.3 查詢(xún)和分析21211.3.4 方法1:Jaccard 相似度21311.3.5 合并21911.3.6 方法2:評(píng)分精確和近似匹配22211.4 本章小結(jié)229第12章 改進(jìn)欺詐檢測(cè)23012.1 目標(biāo):改進(jìn)欺詐檢測(cè)23012.2 解決方案:使用關(guān)系創(chuàng)建更智能的模型23112.3 使用TigerGraph ML Workbench23212.3.1 設(shè)置ML Workbench23212.3.2 使用ML Workbench 和 Jupyter Notes23312.3.3 圖模式和數(shù)據(jù)集23412.3.4 圖特征工程23612.3.5 用圖特征訓(xùn)練傳統(tǒng)模型23712.3.6 使用圖神經(jīng)網(wǎng)絡(luò)23912.4 本章小結(jié)24212.5 與你聯(lián)系242