本書是在大數據框架下,全面介紹金融科技在處理真實場景金融問題時需要掌握的最重要的幾類機器學習方法,并將重點放在實施過程中需要用到的特征提取、可解釋性、隱私保護與數據安全共享等相關內容的討論上。
本書內容分三部分:第一部分由1~6章組成,主要講常規情況下,機器學習在金融場景特別是大數據風控中的建模應用;第二部分由第7章和第8章組成,主要講在數據隱私保護和安全要求下,機器學習如何進行大數據風控建模;第三部分由9~16章組成,主要講如何基于吉布斯抽樣算法建立特征提取的理論
和標準框架及其在包含投資和融資等7個不同金融場景中的應用。
本書具有五個特點:一是面向應用需求,介紹機器學習在金融場景特別是大數據風控中的建模應用;二是緊扣應用,聚焦智能投顧和大數據信用評價兩大領域;三是針對算法,重點講邏輯回歸和集成學習建模;四是針對數據安全和隱私保護問題,建立密文機器學習模型,實現數據共享;五是針對特征工程,基于吉布斯抽樣算法,建立支持非線性特征提取的理論和標準框架。