本書針對當前空間-文本數據的查詢與推薦領域中亟待解決的空間關鍵字語義近似查詢、查詢結果典型化分析和多樣性興趣點推薦等問題進行闡述,以多年來在該方面發表的學術論文為基礎,對所取得的相關成果進行了詳細的分類,對成果的創新性進行詳細的總結,內容主要包括:空間-文本數據的查詢索引結構,基于CGAN的空間關鍵字查詢語義擴展方法,空間-文本-數值相融合的混合索引結構,查詢結果的典型化分析與top-k選取,多樣性與個性化興趣點推薦方法等。
張霄雁,遼寧工程技術大學工程師,在讀博士,主持遼寧省教育廳項目1項,參與國家自然科學基金、遼寧省自然科學基金和遼寧省教育廳項目等5項。主講本科生核心課程2門,發表學術論文20余篇,出版學術專著1部。
目 錄
第1章 空間-文本數據查詢的基礎理論和相關技術 1
1.1 空間關鍵字查詢方法研究現狀 1
1.2 空間-文本對象和空間關鍵字查詢 3
1.2.1 空間-文本對象和空間關鍵字查詢的定義 3
1.2.2 空間關鍵字查詢的處理方法 4
1.2.3 查詢關鍵字拼寫錯誤的處理方法 6
1.3 空間索引結構R-Tree 7
1.3.1 R-Tree結構 7
1.3.2 R-Tree查詢操作 8
1.3.3 R-Tree插入操作 9
1.3.4 R-Tree刪除操作 11
1.4 空間-文本混合索引結構 12
1.4.1 IR-Tree結構 12
1.4.2 IR-Tree實例 13
1.5 本章小結 15
1.6 參考文獻 15
第2章 基于CGAN的空間關鍵字語義近似查詢 18
2.1 引言 18
2.2 問題定義和解決方案 20
2.2.1 問題定義 20
2.2.2 解決方案 21
2.3 空間關鍵字查詢語義擴展 22
2.3.1 GAN和CGAN 22
2.3.2 CGAN生成器的構建 24
2.3.3 判別器的構建 26
2.3.4 CGAN的構建 26
2.4 查詢與結果的相關性評估 27
2.4.1 文本相似度評估 27
2.4.2 數值滿意度評估 28
2.4.3 綜合評分函數 30
2.5 索引結構與查詢匹配算法 30
2.5.1 索引結構 30
2.5.2 實現算法 31
2.6 效果與性能實驗評價 35
2.6.1 實驗環境 35
2.6.2 CGAN模型的實現與效果 36
2.6.3 查詢效果實驗 39
2.6.4 查詢效率實驗 41
2.7 本章小結 44
2.8 參考文獻 44
第3章 查詢結果典型程度分析與top-k近似選取 46
3.1 引言 46
3.2 問題定義和解決方案 47
3.2.1 問題定義 47
3.2.2 解決方案 48
3.3 空間對象之間的距離評估 49
3.3.1 基于關鍵字耦合關系與核函數的文本語義距離評估 49
3.3.2 基于Word2Vec和CNN的文本語義距離評估 52
3.3.3 空間對象在各維度上的綜合距離 54
3.4 查詢結果的典型程度量化與top-k近似選取 54
3.4.1 查詢結果的典型程度量化方法 54
3.4.2 top-k典型結果的近似選取 56
3.5 效果與性能實驗評價 59
3.5.1 實驗環境 59
3.5.2 空間對象文本信息的語義相似度評估準確性測試 60
3.5.3 空間對象典型程度評估與top-k近似選取算法的效果測試 62
3.5.4 top-k近似算法的性能測試 65
3.6 本章小結 66
3.7 參考文獻 66
第4章 多樣性與個性化興趣點推薦方法 68
4.1 引言 68
4.2 興趣點推薦的國內外研究現狀分析 69
4.3 問題定義和解決方案 70
4.3.1 問題定義 70
4.3.2 解決方案 70
4.4 位置-社會關系模型 71
4.4.1 相關定義 71
4.4.2 位置-社會關系距離 71
4.5 興趣點聚類劃分 73
4.5.1 基于譜聚類的興趣點聚類方法 73
4.5.2 興趣點聚類劃分示例 75
4.6 多樣性與個性化興趣點選取 76
4.7 效果與性能實驗評價 78
4.7.1 實驗數據 78
4.7.2 興趣點的位置-社會關系模型效果實驗 79
4.7.3 推薦效果實驗 83
4.8 本章小結 90
4.9 參考文獻 90
第5章 基于圖神經網絡的興趣點推薦方法 92
5.1 引言 92
5.2 圖神經網絡和基于位置的社交網絡 94
5.2.1 圖神經網絡 94
5.2.2 基于位置的社交網絡 97
5.3 相關定義和解決方案 98
5.3.1 相關定義 98
5.3.2 解決方案模型 99
5.4 具體實現方法 101
5.4.1 用戶嵌入向量建模 101
5.4.2 興趣點嵌入向量建模 104
5.4.3 評分預測 110
5.4.4 模型訓練 110
5.5 效果與實驗性能分析 112
5.5.1 實驗數據 112
5.5.2 比較方法 113
5.5.3 實驗設置 113
5.5.4 實驗結果分析 114
5.6 本章小結 121
5.7 參考文獻 121
第6章 基于用戶偏好的下一個興趣點推薦方法 123
6.1 引言 123
6.2 下一個興趣點推薦的國內外研究現狀 125
6.2.1 基于馬爾可夫模型的方法 126
6.2.2 基于嵌入的方法 127
6.2.3 基于神經網絡模型的方法 127
6.3 相關定義和解決方案 128
6.4 用戶關系挖掘 130
6.4.1 構建用戶關系圖 130
6.4.2 用戶關系嵌入學習 132
6.5 用戶偏好建模 133
6.5.1 長期偏好建模 133
6.5.2 用戶的短期偏好和當前偏好建模 133
6.5.3 周期偏好 135
6.6 模型訓練 136
6.7 實驗結果與分析 137
6.7.1 實驗環境與數據 137
6.7.2 實驗及結果分析 138
6.7.3 神經網絡神經元個數的影響 141
6.7.4 模型結構的影響 142
6.7.5 迭代次數的影響 143
6.7.6 朋友關系和偏好相似關系權重的影響 144
6.8 本章小結 145
6.9 參考文獻 145