本書以數據工程的基本理論為基礎,以數據工程建設的流程為框架,介紹了數據工程概論、數據規劃設計、數據模型構建、數據采集與數據處理、數據存儲與數據管理、數據分析與數據挖掘、數據共享應用、數據標準規范、數據工程實踐案例等內容。其具體內容為:第1章重點介紹數據工程涉及的概念、體系架構、國內外建設發展情況;第2章到第8章詳細介紹數據工程具體建設活動的理論基礎、技術方法、工具手段等;第9章介紹了一個數據工程實踐案例。
本書面向所有的數據工作者從事或學習數據工程的理論研究、技術創新、實踐運用相關的科研人員、管理人員、咨詢人員、教師、高等院校的研究生等,也適合對數據工程有興趣的其他讀者群體。
本書有以下鮮明特點:
(1)理論體系創新。本書基于體系維、標準維和技術維共同支撐的總體架構,同時在數據規劃設計、本體模型構建以及采集處理方法、存儲設計策略、共享支撐體系等方面也提出了一些具有創新性的理論方法。
(2)實踐案例新穎。本書基于作者所從事的訓練領域中的數據工程建設工作,設計了一個典型的實踐案例,該案例資料豐富、形式新穎,理論與實踐結合緊密,在實際應用中也體現了創新設計,具有很好的學習參考性。
(3)可操作性強。本書提到的實施數據工程的思路,來源于作者多年工作實踐經驗的總結和提煉,可操作性很強,有一定的示范作用。