近年來,“本體”這個概念在智能信息集成、Intemet信息檢索、知識管理、語義Web、數字圖書館等眾多領域廣為流傳。本體能夠流行的一個主要原因是本體提供了人與計算機之間以及機器與機器之間對領域知識的共享和共同的理解。于是,用于領域本體獲取的機器學習模型或稱“本體學習”近年來成為一個非常熱門的研究方向。
從認知的觀點看,目前的本體學習主要集中在概念獲取、公理獲取、關系獲取等層面。確切地說,上述本體學習算法應該被稱為本體挖掘算法,因為在本體形成階段的工作仍然是手工的或半自動的,需要人利用本體構建工具參與本體形成的過程,其主要原因在于對本體學習過程中學習者的認知狀態及其變化過程缺乏深入的研究。
要深入地研究本體學習,就要研究學習者的認知狀態及其在學習過程中的變化。認知科學研究的一些成果說明和解釋了人在完成認知活動時是如何進行信息加工的。鑒于此,結合現代認知主義學習理論的成果,本書提出本體學習的認知模型,用來描述本體學習過程中學習者的認知狀態及其變化,并用形式化的方法來表示該模型中的知識,對已學習的知識進行歸納泛化,對矛盾知識的修正以及對過時的知識進行更新等認知策略的具體操作,從而進一步建立本體自動學習的認知模型,探索本體自動構建的關鍵過程和技術。
本書的主要研究結果如下。
(1)在綜合機器學習理論與認知主義學習理論的基礎上,提出本體學習的認知模型,并給出其形式化表示。在該模型中,把本體學習過程看作一個認知過程,通過7種不同的認知策略來實現,即斷言獲得、本體擴展、本體縮減、本體歸納、本體演繹、本體修正和本體更新。本書討論了除斷言獲得策略以外的6種策略。
(2)為進一步討論本體學習認知模型的實現,基于本體系統的本體論假定,建立本體知識表示模型,給出了本體的形式定義,提出了本體系統的描述語言和推理規則,定義了本體的協調性及其邏輯閉包的協調性。
(3)在本體知識表示模型的基礎上,建立了基于公理化認知模型的本體學習系統。用公理化的方法為學習模型中的5個認知操作:本體擴展“+”、本體縮減“一”、本體歸納“<”、本體修正“o,‘和本體更新”o“建立了相關的假定、公理體系,給出了操作的具體算子,并證明這些算子滿足所建立的公理系統。
(4)討論了本體學習的認知模型中歸納算子、修正算子和更新算子中存在的問題及可能的解決方法。從修正與更新的最小改變原則的要求出發,提出丁從類結構差異和類的差異兩個層次進行本體比較的算法。
(5)給出了基于本體學習認知模型的本體自動構建工具原型系統,并對該系統的應用案例作了分析。
(6)總結展望了本體學習技術的發展方向。
自2000年以來,作者在中國科學院計算技術研究所曹存根研究員、眭躍飛研究員和云南師范大學林毓材教授的指導下,開始接觸知識工程的研究,后來在從事本體工程、本體學習方面的研究中一直都得到幾位老師的悉心指導,在攻讀博士學位期間還得到了云南大學曹克非教授的指導,在此特向各位恩師表示衷心的感謝。
收起全部↑
張德海,博士,云南大學副教授,云南大學中青年骨干教師,云南省青年骨干教師。IEEE會員,中國人工智能學會(CAAI)會員,國際計算機科學與信息技術學會(IACSIT)會員。主要從事人工智能、知識工程、系統分析與集成及大數據分析的研究。
主持國家基金、省基金及橫向項目20余項,發表論文30余篇,公開申請國際發明專利及國家發明專利15項,軟件著作權12項。參與云南省政府政策研究室項目,主持或參與多個智慧城市、領域大數據應用項目。