圖分析與圖機器學習:原理、算法與實踐 [美]維克多·李 [荷]阮福堅 [美]亞歷山大·托馬斯
定 價:¥89
中 教 價:¥53.40 (6.00折)
庫 存 數(shù): 37
本書的目標是向你介紹圖數(shù)據(jù)結(jié)構(gòu)、圖分析和圖機器學習的概念、技術(shù)和工具。每章的開頭都列出了目標,大致分為三個方面:學習圖分析和機器學習的概念;用圖分析解決特定問題;了解如何使用GSQL查詢語言和TigerGraph圖平臺。首先介紹圖數(shù)據(jù)的基本概念,然后通過連接、分析、學習三大部分深入講解一些圖算法和機器學習技術(shù)。
隨著圖形數(shù)據(jù)庫的迅速崛起,企業(yè)正在實施高級分析和機器學習解決方案,以幫助推動業(yè)務(wù)成果。本實用指南向數(shù)據(jù)科學家、數(shù)據(jù)工程師、架構(gòu)師和業(yè)務(wù)分析師展示了如何使用領(lǐng)先的圖形數(shù)據(jù)庫模型TigerGraph開始使用圖形數(shù)據(jù)庫。你將探索從互聯(lián)數(shù)據(jù)中獲取價值的三階段方法:連接、分析和學習。三位作者介紹了涵蓋多種當代業(yè)務(wù)需求的真實使用案例。通過使用TigerGraph Cloud進行實踐練習,你將很快熟練掌握為企業(yè)設(shè)計和管理高級分析和機器學習解決方案的方法。
前言
目標本書的目標是向你介紹圖數(shù)據(jù)結(jié)構(gòu)、圖分析和圖機器學習的概念、技術(shù)和工具。當你讀 完這本書時,我們希望你能理解如何使用圖分析來解決一系列現(xiàn)實世界的問題。我們希 望你能夠回答以下問題:圖是否適合任務(wù)?應該使用哪些工具和技術(shù)?數(shù)據(jù)中有哪些有 意義的關(guān)系,應該如何根據(jù)關(guān)系分析來制定任務(wù)?根據(jù)經(jīng)驗,我們發(fā)現(xiàn)許多人能夠快速掌握圖的一般概念和結(jié)構(gòu),但要思考圖,要培 養(yǎng)如何最佳地將數(shù)據(jù)建模為圖的直覺,然后將分析型任務(wù)制定為圖查詢,則需要更多 的努力和經(jīng)驗。幾乎每章的開頭都列出了對應的目標,它們大致分為三個方面:學習 圖分析和機器學習的概念;用圖分析解決特定問題;了解如何使用 GSQL 查詢語言和 TigerGraph 圖平臺。目標讀者和前提條件本書的目標讀者是對數(shù)據(jù)分析感興趣并想學習圖分析的人。你不必是一位嚴肅的程序員 或數(shù)據(jù)科學家,但了解一些數(shù)據(jù)庫和編程的概念肯定有助于你理解本書內(nèi)容。當我們深 入講解一些圖算法和機器學習技術(shù)時,我們會給出一些涉及集合、求和與極限的數(shù)學方 程式。這些方程式只是本書文字和圖像的補充。在本書的案例部分,我們將在 TigerGraph Cloud 平臺上運行預先編寫好的 GSQL 代碼。 你只需要一臺可以訪問互聯(lián)網(wǎng)的計算機即可。如果你熟悉 SQL 數(shù)據(jù)庫查詢語言和任意主 流編程語言,那么你將能夠理解大部分的 GSQL 代碼。如果你不熟悉它們,也可以簡單 地按照說明并跟隨書中的注釋來運行預先編寫的案例示例。
閱讀方法和路線我們旨在以實際的數(shù)據(jù)分析需求(而不是理論原理)為導向來呈現(xiàn)內(nèi)容。我們會嘗試使 用最簡單的術(shù)語來解釋事情,并盡量使用日常概念而不是難懂的技術(shù)術(shù)語。本書通過完整的示例來介紹 GSQL 語言。在本書開頭,我們逐行描述了每行示例代碼的 目的和功能。我們還對特別重要的語言結(jié)構(gòu)、語法和語義進行了強調(diào)。若要獲得更全面 的 GSQL 教程,可以參閱本書之外的其他資源。
Victor Lee是TigerGraph機器學習和人工智能副總裁。他的博士論文是關(guān)于基于圖的相似性和排序的。Lee博士與他人合作撰寫了關(guān)于決策樹和密集子圖發(fā)現(xiàn)的書籍章節(jié)。 教學和培訓也是他職業(yè)生涯的核心工作,從開發(fā)芯片設(shè)計培訓材料到撰寫TigerGraph的第1版技術(shù)文檔,從擔任12年課堂講師到主持大量網(wǎng)絡(luò)研討會和現(xiàn)場研討會,他都參與其中。Phuc Kien Nguyen是荷蘭銀行反洗錢和恐怖主義融資領(lǐng)域的數(shù)據(jù)科學家。他擁有代爾夫特理工大學的信息架構(gòu)碩士學位。Alexander Thomas是前TigerGraph技術(shù)作家,擁有語言學和教育背景。
黃凱,碩士研究生,畢業(yè)于北京理工大學,現(xiàn)任北京速通科技有限公司軟件研發(fā)中心總工程師,主要從事于高可用、高性能、高并發(fā)的后臺服務(wù)系統(tǒng)開發(fā),對微服務(wù)架構(gòu)、容器技術(shù)有一定的研究,對底層應用開發(fā)具有較深的了解,主導研發(fā)了多個ETC相關(guān)系統(tǒng)。
目錄前言1第1章 連接就是一切71.1 連接改變一切81.1.1 什么是圖81.1.2 圖的重要性91.1.3 邊連接優(yōu)于表連接101.2 圖分析和機器學習131.3 本章小結(jié)14第一部分 連接第2章 連接并探索數(shù)據(jù)192.1 圖的結(jié)構(gòu)202.1.1 圖的術(shù)語202.1.2 圖的模式242.2 圖的遍歷262.2.1 跳數(shù)和距離262.2.2 廣度和深度272.3 圖的建模272.3.1 圖模式選項和權(quán)衡272.3.2 表格轉(zhuǎn)換為圖312.3.3 模型演進332.4 圖的能力332.4.1 連接點342.4.2 360度視圖342.4.3 深入洞察352.4.4 尋找并發(fā)現(xiàn)模式372.4.5 匹配和合并382.4.6 加權(quán)和預測392.5 本章小結(jié)40第3章 更好地了解客戶和業(yè)務(wù):360圖423.1 案例1:跟蹤和分析客戶旅程423.2 解決方案:Customer 360 旅程圖433.3 實現(xiàn)C360 旅程圖:一個GraphStudio教程453.3.1 創(chuàng)建TigerGraph Cloud賬戶453.3.2 獲取并安裝Customer 360入門套件463.3.3 GraphStudio概述483.3.4 設(shè)計圖模式483.3.5 加載數(shù)據(jù)503.3.6 查詢和分析503.4 案例2:藥物不良反應分析603.5 解決方案:藥物相互作用360圖603.6 實現(xiàn)613.6.1 圖模式613.6.2 查詢和分析623.7 本章小結(jié)69第4章 研究創(chuàng)業(yè)投資704.1 目標:找到有前途的創(chuàng)業(yè)公司704.2 解決方案:創(chuàng)業(yè)投資圖714.3 實現(xiàn)創(chuàng)業(yè)投資圖以及查詢724.3.1 Crunchbase入門套件724.3.2 圖模式724.3.3 查詢和分析744.4 本章小結(jié)88第5章 檢測欺詐和洗錢模式905.1 目標:檢測金融犯罪905.2 解決方案:將金融犯罪建模為網(wǎng)絡(luò)模式915.3 實施金融犯罪模式搜索925.3.1 欺詐和洗錢檢測入門套件925.3.2 圖模式925.3.3 查詢和分析935.4 本章小結(jié)102第二部分 分析第6章 深入洞察:分析連接的重要性1056.1 了解圖分析1056.1.1 分析要求1066.1.2 圖遍歷方法1066.1.3 并行處理1076.1.4 聚合1076.2 使用圖算法進行分析1096.2.1 將圖算法作為工具1096.2.2 圖算法分類1106.3 本章小結(jié)127第7章 更好的推薦和建議1287.1 案例1:改善醫(yī)療轉(zhuǎn)診1287.2 解決方案:構(gòu)建和分析轉(zhuǎn)診圖1297.3 實現(xiàn)醫(yī)療專家轉(zhuǎn)診網(wǎng)絡(luò)1297.3.1 醫(yī)療轉(zhuǎn)診網(wǎng)絡(luò)入門套件1297.3.2 圖模式1307.3.3 查詢和分析1317.4 案例2:個性化推薦1397.5 解決方案:使用圖進行基于多關(guān)系的推薦1407.6 實現(xiàn)多關(guān)系推薦引擎1407.6.1 推薦引擎2.0入門套件1407.6.2 圖模式1407.6.3 查詢和分析1427.7 本章小結(jié)150第8章 加強網(wǎng)絡(luò)安全1518.1 網(wǎng)絡(luò)攻擊的代價1518.2 挑戰(zhàn)1528.3 解決方案1528.4 實現(xiàn)網(wǎng)絡(luò)安全圖1538.4.1 網(wǎng)絡(luò)安全威脅檢測入門套件1538.4.2 圖模式1538.4.3 查詢和分析1548.5 本章小結(jié)163第9章 航空公司航線分析1649.1 目標:分析航空公司航線1649.2 解決方案:航線網(wǎng)絡(luò)的圖算法1659.3 實現(xiàn)機場和航線分析器1659.3.1 圖算法入門套件1659.3.2 圖模式和數(shù)據(jù)集1659.3.3 安裝GDS庫中的算法1669.3.4 查詢和分析1679.4 本章小結(jié)178第三部分 學習第10章 圖驅(qū)動的機器學習算法18110.1 基于圖算法的無監(jiān)督學習18210.1.1 通過相似性和社區(qū)結(jié)構(gòu)來學習18210.1.2 尋找頻繁模式18310.2 提取圖特征18410.2.1 領(lǐng)域無關(guān)特征18510.2.2 領(lǐng)域相關(guān)特征18810.2.3 圖嵌入:一個全新的世界19110.3 圖神經(jīng)網(wǎng)絡(luò)19910.3.1 圖卷積網(wǎng)絡(luò)19910.3.2 GraphSAGE20310.4 圖機器學習方法的比較20510.4.1 機器學習任務(wù)的用例20510.4.2 模式發(fā)現(xiàn)與特征提取方法20610.4.3 圖神經(jīng)網(wǎng)絡(luò):總結(jié)與應用20710.5 本章小結(jié)207第11章 重新審視實體解析20811.1 問題描述:識別現(xiàn)實世界的用戶及其品味20811.2 解決方案:基于圖的實體解析20911.2.1 確實哪些實體是相同的20911.2.2 實體解析21011.3 實現(xiàn)基于圖的實體解析21111.3.1 數(shù)據(jù)庫內(nèi)實體解析入門套件21111.3.2 圖模式21111.3.3 查詢和分析21211.3.4 方法1:Jaccard 相似度21311.3.5 合并21911.3.6 方法2:評分精確和近似匹配22211.4 本章小結(jié)229第12章 改進欺詐檢測23012.1 目標:改進欺詐檢測23012.2 解決方案:使用關(guān)系創(chuàng)建更智能的模型23112.3 使用TigerGraph ML Workbench23212.3.1 設(shè)置ML Workbench23212.3.2 使用ML Workbench 和 Jupyter Notes23312.3.3 圖模式和數(shù)據(jù)集23412.3.4 圖特征工程23612.3.5 用圖特征訓練傳統(tǒng)模型23712.3.6 使用圖神經(jīng)網(wǎng)絡(luò)23912.4 本章小結(jié)24212.5 與你聯(lián)系242