計算機視覺 Python+TensorFlow+Keras深度學習實戰 微課視頻版
定 價:¥39.8
中 教 價:¥33.83 (8.50折)
庫 存 數: 0
人工智能正在成為全世界產業變革的方向,處于第四次科技革命的核心地位。計算機視覺(Computer Vision)就是利用攝像機、算法和計算資源為人工智能系統按上眼睛,讓其可以擁有人類的雙眼所具有的前景與背景分割、物體識別、目標跟蹤、判別決策等功能。計算機視覺系統可以讓計算機看見并理解這個世界的信息,從而替代人類完成重復性工作。目前計算機視覺領域熱門的研究方向有物體檢測和識別、語義分割、目標跟蹤等。本書圍繞著計算機視覺的關鍵技術,介紹基于深度學習計算機視覺的基礎理論及主要算法。本書結合常見的應用場景和項目實例,循序漸進地帶領讀者進入美妙的計算機視覺世界。本書共分為11章,2~5章介紹計算機視覺的幾種關鍵技術,即圖像分類、目標檢測、圖像分割和目標跟蹤,并將這四項關鍵技術組合完成人工智能的實際應用。本書在6、7章介紹人工智能的兩個典型應用:文字檢測與識別系統及多任務深度學習系統,第8章介紹一種非常有意思的深度學習網絡對抗生成神經網絡,第9章介紹制作訓練和測試樣本的方法,第10章介紹如何安裝TensorFlow、Keras API及相關介紹,第11章介紹綜合實驗。本書提供了大量項目實例及代碼解析,均是基于Python語言及TensorFlow、Keras API的。本教材的每章均配有微課視頻,掃描每章的二維碼,可觀看作者的視頻講解
本書在多年科研積累的基礎上,指導讀者建立以理論 實踐 前沿為導向的計算機視覺學習思路,后以基于YOLO和DeepSort的目標檢測與跟蹤的綜合案例完成實踐
計算機視覺是人工智能領域的一個重要組成部分,它的主要任務是對采集的圖片或視頻進行處理以獲得相應信息。傳統的計算機視覺算法的主要步驟是提取包括邊緣、角點、顏色等圖像特征,然后利用這些圖像特征完成圖像處理與機器學習的任務。傳統算法的主要問題在于需要告訴系統在圖像中尋找哪些圖像特性。由于提取圖像特征部分是人為設計的,在實現的過程中,對于算法、功能及閾值的更改都需要手工完成,這對高質量的項目實現造成了很大的障礙,而深度學習的出現解決了這一問題。當前,深度學習在處理計算機視覺子任務方面取得了重大進展。深度學習的不同之處在于它不再通過精心設計的算法來搜索特定的圖像特征,而是通過訓練大量的神經網絡參數來實現。本書將從計算機視覺的四大關鍵技術出發,詳細介紹基于深度學習的計算機視覺技術的基礎理論、主要算法項目實戰及代碼實現。本書結合常見的人工智能應用場景,循序漸進地帶領讀者進入美妙的計算機視覺世界。 第1章介紹人工智能概述,對人工智能的發展歷程及常見的應用案例進行詳細介紹;第2章講解卷積神經網絡的基本原理,幾種常見的深度卷積神經網絡框架,并介紹圖像分類的項目實戰;第3章主要講解目標檢測的基本原理,幾種典型的目標檢測算法,并介紹目標檢測的項目實戰;第4章講解圖像分割的基本原理,幾種典型的圖像分割算法,結合項目實戰使讀者進一步理解圖像分割算法;第5章介紹目標跟蹤的基本原理,幾種典型的目標跟蹤算法,并通過項目實戰介紹目標跟蹤算法的實現過程;第6章講解文字檢測與識別系統的基本構成及原理,幾種典型的文字檢測及識別算法,并通過項目實戰進一步介紹文字檢測與識別的實現過程;第7章講解多任務深度學習網絡的原理、構建方法和實用技巧,并通過項目實例給出了易于理解的項目實戰方法;第8章講解生成對抗神經網絡的基本原理,介紹幾種典型的生成對抗神經網絡算法,并通過項目實例介紹生成對抗神經網絡的構建過程;第9章主要講解怎樣制作訓練樣本,包括數據的標注及數據增強兩部分;第10章介紹Keras和API的安裝方法;第11章介紹綜合實驗。按照以上章節介紹的理論及案例,就可以逐步開啟計算機視覺的項目實戰了。 時光荏苒,歲月如梭,轉眼研究計算機視覺與神經網絡已經近二十個年頭了,感謝引領我進入這個領域的恩師谷荻隆嗣教授,在教授那里學習到的研究方法和學術態度讓我受益終身。在漫長歲月里,由于計算資源的限制和一些結構上的缺陷,神經網絡一度備受冷落,由衷地敬佩和感慨Geoffrey Hinton教授在這一領域鍥而不舍地堅持和奉獻,讓深度學習真正地進入了產業界,解決了我在漫長二十年的學術生涯中遇到的多個百思不得其解的難題。同樣感謝我的學生們的支持和奉獻。本書的部分章節參考了我指導的研究生黃偉杰、裴柳、李博、李雪倩、支勇、王貝貝的碩士論文及畢業設計成果。在撰寫書稿的過程中,重新翻開同學們的畢業論文,在一起奮戰的日日夜夜一幕幕地浮現在眼前。傳承、融入、影響、身教、合作、困惑與頓悟匯成了我對計算機視覺的全部理解。 編 者 2021年7月
北京交通大學教授、博士生導師,曾任日本SECOM東京研究院研究員。從事人工智能、計算機視覺技術的教學與科研工作,在智能監控、無人系統視覺感知、車載視覺環境感知、基于視覺的表面缺陷檢測、運輸載體故障診斷等方向有著多年的科研經驗。近年來主持國家自然科學基金、北京市科委重點研發專項等、省部級、企業合作項目,共計30余項。在國際重要的學術期刊與會議上發表論文60余篇,其中被SCI收錄論文20余篇,被授權發明專利6項(日本發明專利3項)。致力于人工智能技術的產業化應用。曾自主研發多套軟件與裝備,如無人系統的視覺感知系統、無人機智能監測系統、智能巡檢系統、煤礦運輸皮帶綜合監測系統、高速鐵路運行安全監測系統等,產生良好的經濟和社會效益。
第1章 人工智能概述 1 1.1 人工智能的發展浪潮 1 1.2 AI技術發展歷史 4 1.2.1 AI技術三要素之算法 4 1.2.2 AI技術三要素之計算資源 6 1.2.3 AI三要素之數據 6 1.3 視頻分析技術的應用案例 9 1.3.1 基于人臉識別技術的罪犯抓捕系統 9 1.3.2 基于文字識別技術的辦公自動化系統 10 1.3.3 基于圖像分割及目標檢測技術的無人駕駛環境感知系統 10 1.3.4 基于目標檢測及跟蹤技術的電子交警系統 10 1.3.5 基于圖像比對技術的產品缺陷檢測系統 10 1.3.6 基于行為識別技術的安全生產管理系統 10 1.4 本章小結 10第2章 深度卷積神經網絡 11 2.1 深度卷積神經網絡的概念 11 2.2 卷積神經網絡的構成 12 2.2.1 卷積層 12 2.2.2 激活函數 12 2.2.3 池化層 14 2.3 深度卷積神經網絡模型結構 14 2.3.1 常用網絡模型 14 2.3.2 網絡模型對比 20 2.4 圖像分類 20 2.5 遷移學習 21 2.6 圖像識別項目實例 22 2.6.1 下載ImageNet的訓練模型 22 2.6.2 ResNet模型構建 23 2.6.3 測試圖像 26 2.7 本章小結 27 2.8 習題 27第3章 目標檢測 28 3.1 目標檢測的概念 28 3.2 基于候選區域的目標檢測算法 29 3.2.1 Faster R-CNN目標檢測算法 30 3.2.2 基于區域的全卷積網絡(R-FCN)目標檢測算法 30 3.3 基于回歸的目標檢測算法 32 3.3.1 YOLO目標檢測算法 32 3.3.2 SSD目標檢測算法 33 3.4 目標檢測算法評價指標 34 3.5 深度卷積神經網絡目標檢測算法性能對比 35 3.6 目標檢測項目實戰 36 3.6.1 Faster R-CNN 36 3.6.2 用YOLO訓練自己的模型 40 3.7 本章小結 43 3.8 習題 43第4章 圖像分割 44 4.1 圖像分割的概念 44 4.2 典型的圖像分割算法 45 4.2.1 FCN分割算法 45 4.2.2 DeepLab分割算法 45 4.2.3 SegNet圖像分割算法 47 4.2.4 U-Net算法 47 4.2.5 Mask R-CNN算法 48 4.3 圖像分割評價標準 49 4.4 圖像分割項目實戰 50 4.4.1 FCN32模型構建 51 4.4.2 FCN8的模型構建 52 4.4.3 Seg-Net的模型構建 53 4.4.4 U-Net的模型構建 56 4.5 本章小結 59 4.6 習題 59第5章 目標跟蹤 60 5.1 圖像分割的概念 60 5.2 基于光流特征的目標跟蹤算法 63 5.2.1 基于光流特征跟蹤算法概述 63 5.2.2 LK光流法 65 5.3 SORT目標跟蹤算法 66 5.3.1 卡爾曼濾波器 66 5.3.2 基于匈牙利算法的數據關聯 68 5.4 Deep SORT多目標跟蹤算法 69 5.4.1 Deep SORT算法跟蹤原理 69 5.4.2 外觀特征間的關聯性計算 69 5.4.3 利用運動信息關聯目標 71 5.4.4 級聯匹配 71 5.5 目標跟蹤算法評價指標 72 5.6 Deep SORT算法主要程序及分析 72 5.6.1 目標檢測框的獲取及坐標轉換 72 5.6.2 卡爾曼濾波 73 5.6.3 深度外觀特征的提取 77 5.6.4 匹配 78 5.6.5 后續處理 79 5.7 本章小結 81 5.8 習題 81第6章 OCR文字識別 82 6.1 OCR文字識別的概念 82 6.2 文字檢測 83 6.2.1 傳統的文字檢測算法 83 6.2.2 基于深度學習的文字檢測算法 83 6.3 文字識別算法 89 6.3.1 基于DenseNet網絡模型的序列特征提取 89 6.3.2 基于LSTM結構的上下文序列特征提取 91 6.3.3 字符序列的解碼方式 92 6.4 項目實戰 95 6.4.1 CRAFT模型搭建 96 6.4.2 CRNN模型搭建 97 6.4.3 文字檢測與識別程序 99 6.5 本章小結 104 6.6 習題 105第7章 多任務深度學習網絡 106 7.1 多任務深度學習網絡的概念 107 7.2 多任務深度學習網絡構建 107 7.2.1 多任務網絡的主要分類 107 7.2.2 并行式網絡 109 7.2.3 級聯式網絡 110 7.3 多任務深度學習網絡的代碼實現 113 7.3.1 構建多任務深度學習網絡 114 7.3.2 多任務深度學習網絡的訓練 116 7.3.3 多任務深度學習模型測試 116 7.4 本章小結 119 7.5 習題 119第8章 生成對抗神經網絡 120 8.1 生成對抗網絡的概念 120 8.2 典型的生成對抗網絡 121 8.2.1 DCGAN 121 8.2.2 CycleGAN 123 8.3 傳送帶表面缺陷樣本增強案例 126 8.4 項目實戰 128 8.4.1 DCGAN 128 8.4.2 CycleGAN 130 8.5 本章小結 132 8.6 習題 132第9章 樣本制作與數據增強 133 9.1 數據的獲取 133 9.2 數據的標注 133 9.2.1 目標檢測與識別標注軟件LabelImg 134 9.2.2 圖像分割標注軟件LabelMe 134 9.3 數據增強 134 9.4 項目實戰:數據增強 135 9.4.1 數據增強庫的安裝與卸載 135 9.4.2 數據增強庫的基本使用 136 9.4.3 樣本數據增強的結果 136 9.4.4 關鍵點變換 137 9.4.5 標注框(Bounding Box)變換 139 9.5 本章小結 141 9.6 習題 141第10章 Keras安裝和API 142 10.1 安裝Keras 142 10.1.1 第1步安裝依賴項 142 10.1.2 第2步安裝TensorFlow 144 10.1.3 第3步安裝Keras 145 10.1.4 第4步測試TensorFlow和Keras 145 10.2 配置Keras 146 10.3 Keras API 146 10.4 TensorFlow API 146 10.5 本章小結 147第11章 綜合實驗:基于YOLO和Deep Sort的目標檢測與跟蹤 148 11.1 算法流程 148 11.2 實驗代碼 149 11.3 實驗評價 155