本書的寫作初衷是,從學(xué)者的角度,用一種通俗易懂的方式,把與基于深度學(xué)習(xí)的目標(biāo)檢測的相關(guān)論文中的理論和方法呈現(xiàn)給讀者,同時(shí)針對作者在深度學(xué)習(xí)教學(xué)過程中遇到的難點(diǎn),進(jìn)行深入的分析和講解。本書側(cè)重對卷積神經(jīng)網(wǎng)絡(luò)的介紹,而深度學(xué)習(xí)的內(nèi)容不止于此。所以,作者將深度學(xué)習(xí)分為有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)三類,將圖像分類、目標(biāo)檢測、語音識別、人臉識別、對抗生成網(wǎng)絡(luò)和AlphaGo圍棋等應(yīng)用場景歸入不同的類別,并分別對其原理進(jìn)行了概括性的講解。本書適合有一定深度學(xué)習(xí)或目標(biāo)檢測學(xué)習(xí)基礎(chǔ)的學(xué)生、研究者、從業(yè)者閱讀。
杜鵬,博士,現(xiàn)任職于華為。2014年起在韓國科學(xué)技術(shù)學(xué)院和新加坡南洋理工大學(xué)從事博士后研究。回國后,曾任杭州電子科技大學(xué)副教授、浙江核新同花順網(wǎng)絡(luò)信息股份有限公司算法研究員。2018年被NVIDIA深度學(xué)習(xí)學(xué)院評為優(yōu)秀校園大使,在SIGGRAPH、PG等國際著名學(xué)術(shù)會議發(fā)表論文10余篇。諶明,博士。2004年加入美國道富集團(tuán),2011年加入浙江核新同花順網(wǎng)絡(luò)信息股份有限公司并任首席技術(shù)官,推動了包括計(jì)算機(jī)視覺、語音技術(shù)、自然語言處理、機(jī)器學(xué)習(xí)等技術(shù)在金融、醫(yī)療等領(lǐng)域的商業(yè)化落地。蘇統(tǒng)華,博士,哈爾濱工業(yè)大學(xué)副教授,自然手寫中文文本識別的開拓者。曾出版手寫漢字識別領(lǐng)域的首本英文專著,以及7本GPU計(jì)算和大數(shù)據(jù)分析方面的譯作,所領(lǐng)導(dǎo)的NVIDIA GPU教育中心連續(xù)4年被NVIDIA評為中國區(qū)優(yōu)秀GPU教育中心。
基礎(chǔ)篇
第1章 深度學(xué)習(xí)概述 2
1.1 深度學(xué)習(xí)發(fā)展簡史 2
1.2 有監(jiān)督學(xué)習(xí) 4
1.2.1 圖像分類 4
1.2.2 目標(biāo)檢測 6
1.2.3 人臉識別 10
1.2.4 語音識別 13
1.3 無監(jiān)督學(xué)習(xí) 18
1.3.1 無監(jiān)督學(xué)習(xí)概述 18
1.3.2 生成對抗網(wǎng)絡(luò) 18
1.4 強(qiáng)化學(xué)習(xí) 21
1.4.1 AlphaGo 21
1.4.2 AlphaGo Zero 23
1.5 小結(jié) 25
參考資料 25
第2章 深度神經(jīng)網(wǎng)絡(luò) 27
2.1 神經(jīng)元 27
2.2 感知機(jī) 30
2.3 前向傳遞 31
2.3.1 前向傳遞的流程 32
2.3.2 激活函數(shù) 33
2.3.3 損失函數(shù) 37
2.4 后向傳遞 40
2.4.1 后向傳遞的流程 40
2.4.2 梯度下降 40
2.4.3 參數(shù)修正 42
2.5 防止過擬合 44
2.5.1 dropout 44
2.5.2 正則化 45
2.6 小結(jié) 46
第3章 卷積神經(jīng)網(wǎng)絡(luò) 47
3.1 卷積層 48
3.1.1 valid卷積 48
3.1.2 full卷積 50
3.1.3 same卷積 51
3.2 池化層 52
3.3 反卷積 53
3.4 感受野 54
3.5 卷積神經(jīng)網(wǎng)絡(luò)實(shí)例 56
3.5.1 LeNet-5 56
3.5.2 AlexNet 58
3.5.3 VGGNet 62
3.5.4 GoogLeNet 64
3.5.5 ResNet 75
3.5.6 MobileNet 76
3.6 小結(jié) 78
進(jìn)階篇
第4章 兩階段目標(biāo)檢測方法 80
4.1 R-CNN 80
4.1.1 算法流程 80
4.1.2 訓(xùn)練過程 81
4.2 SPP-Net 85
4.2.1 網(wǎng)絡(luò)結(jié)構(gòu) 85
4.2.2 空間金字塔池化 86
4.3 Fast R-CNN 87
4.3.1 感興趣區(qū)域池化層 87
4.3.2 網(wǎng)絡(luò)結(jié)構(gòu) 89
4.3.3 全連接層計(jì)算加速 90
4.3.4 目標(biāo)分類 91
4.3.5 邊界框回歸 92
4.3.6 訓(xùn)練過程 93
4.4 Faster R-CNN 97
4.4.1 網(wǎng)絡(luò)結(jié)構(gòu) 98
4.4.2 RPN 99
4.4.3 訓(xùn)練過程 105
4.5 R-FCN 107
4.5.1 R-FCN網(wǎng)絡(luò)結(jié)構(gòu) 108
4.5.2 位置敏感的分?jǐn)?shù)圖 109
4.5.3 位置敏感的RoI池化 110
4.5.4 R-FCN損失函數(shù) 111
4.5.5 Caffe網(wǎng)絡(luò)模型解析 111
4.5.6 U-Net 115
4.5.7 SegNet 116
4.6 Mask R-CNN 117
4.6.1 實(shí)例分割簡介 118
4.6.2 COCO數(shù)據(jù)集的像素級標(biāo)注 119
4.6.3 網(wǎng)絡(luò)結(jié)構(gòu) 120
4.7 小結(jié) 123
參考資料 123
第5章 單階段目標(biāo)檢測方法 125
5.1 SSD 125
5.1.1 default box 125
5.1.2 網(wǎng)絡(luò)結(jié)構(gòu) 126
5.1.3 Caffe網(wǎng)絡(luò)模型解析 127
5.1.4 訓(xùn)練過程 135
5.2 RetinaNet 137
5.2.1 FPN 137
5.2.2 聚焦損失函數(shù) 139
5.3 RefineDet 140
5.3.1 網(wǎng)絡(luò)模型 141
5.3.2 Caffe網(wǎng)絡(luò)模型解析 143
5.3.3 訓(xùn)練過程 152
5.4 YOLO 153
5.4.1 YOLO v1 153
5.4.2 YOLO v2 155
5.4.3 YOLO v3 157
5.5 目標(biāo)檢測算法應(yīng)用場景 159
5.5.1 高速公路坑洞檢測 160
5.5.2 息肉檢測 161
5.6 小結(jié) 162
參考資料 162
應(yīng)用篇
第6章 肋骨骨折檢測 166
6.1 國內(nèi)外研究現(xiàn)狀 166
6.2 解決方案 168
6.3 預(yù)處理 168
6.4 肋骨骨折檢測 169
6.5 實(shí)驗(yàn)結(jié)果分析 170
6.6 小結(jié) 172
參考資料 173
第7章 肺結(jié)節(jié)檢測 174
7.1 國內(nèi)外研究現(xiàn)狀 174
7.2 總體框架 176
7.2.1 肺結(jié)節(jié)數(shù)據(jù)集 176
7.2.2 肺結(jié)節(jié)檢測難點(diǎn) 177
7.2.3 算法框架 177
7.3 肺結(jié)節(jié)可疑位置推薦算法 178
7.3.1 CT圖像的預(yù)處理 179
7.3.2 肺結(jié)節(jié)分割算法 180
7.3.3 優(yōu)化方法 182
7.3.4 推斷方法 184
7.4 可疑肺結(jié)節(jié)定位算法 185
7.5 實(shí)驗(yàn)結(jié)果與分析(1) 186
7.5.1 實(shí)驗(yàn)結(jié)果 186
7.5.2 改進(jìn)點(diǎn)效果分析 186
7.6 假陽性肺結(jié)節(jié)抑制算法 188
7.6.1 假陽性肺結(jié)節(jié)抑制網(wǎng)絡(luò) 188
7.6.2 優(yōu)化策略 192
7.6.3 推斷策略 194
7.7 實(shí)驗(yàn)結(jié)果與分析(2) 194
7.7.1 實(shí)驗(yàn)結(jié)果 195
7.7.2 改進(jìn)點(diǎn)效果分析 195
7.7.3 可疑位置推薦與假陽性抑制算法的整合 197
7.8 小結(jié) 197
參考資料 197
第8章 車道線檢測 200
8.1 國內(nèi)外研究現(xiàn)狀 200
8.2 主要研究內(nèi)容 202
8.2.1 總體解決方案 202
8.2.2 各階段概述 203
8.3 車道線檢測系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn) 206
8.3.1 車道線圖像數(shù)據(jù)標(biāo)注與篩選 206
8.3.2 車道線圖片預(yù)處理 208
8.3.3 車道線分割模型訓(xùn)練 212
8.3.4 車道線檢測 221
8.3.5 車道線檢測結(jié)果 225
8.4 車道線檢測系統(tǒng)性能測試 225
8.4.1 車道線檢測質(zhì)量測試 225
8.4.2 車道線檢測時(shí)間測試 227
8.5 小結(jié) 227
參考資料 228
第9章 交通視頻分析 229
9.1 國內(nèi)外研究現(xiàn)狀 230
9.2 主要研究內(nèi)容 231
9.2.1 總體設(shè)計(jì) 232
9.2.2 精度和性能要求 232
9.3 交通視頻分析 233
9.3.1 車輛檢測和車牌檢測 233
9.3.2 車牌識別功能設(shè)計(jì)詳解 235
9.3.3 車輛品牌及顏色的識別 243
9.3.4 目標(biāo)跟蹤設(shè)計(jì)詳解 244
9.4 系統(tǒng)測試 247
9.4.1 車輛檢測 248
9.4.2 車牌檢測 251
9.4.3 車牌識別 253
9.4.4 車輛品牌識別 256
9.4.5 目標(biāo)跟蹤 258
9.5 小結(jié) 259
參考資料 260