本書主要內容包括語義圖像分割相關理論和具體事項,在介紹語義圖像分割目的和相關技術及傳統分割算法的基礎上,講述了從神經網絡到深度學習的發展過程,重點介紹了全卷積網絡,通過采用卷積神經網絡實現了從圖像像素到像素類別的變換;從而進一步介紹了基于全卷積網絡改進的Unet網絡,以及兩種基于全卷積網絡的 SegNet網絡:正常版與貝葉斯版。另外,本書還介紹了圖像分割算法DeepLab v1、v2、v3和v3+以及圖卷積神經網絡,以及為實現性能與實時雙提高的輕量實時語義分割Enet網絡、殘差編碼器-解碼器網絡RED-Net、RefineNet,通過顯式利用了下采樣過程的所有信息,使用遠程殘差連接來實現高分辨率的預測。
主持國家自然科學基金、廣東省自然科學基金等科研項目6項,以第一發明人申請并授權國家發明專利2項