基于深度學(xué)習(xí)的圖像處理與實(shí)踐
定 價(jià):¥99
中 教 價(jià):¥59.40 (6.00折)
庫 存 數(shù): 17
《基于深度學(xué)習(xí)的圖像處理與實(shí)踐》循序漸進(jìn)、深入淺出地講解了基于深度學(xué)習(xí)的圖像處理的核心知識,并通過具體實(shí)例演示了開發(fā)深度學(xué)習(xí)圖像處理程序的方法和流程。全書共 14 章,分別講解了圖像識別技術(shù)基礎(chǔ),scikit-image數(shù)字圖像處理,OpenCV 圖像視覺處理,dlib機(jī)器學(xué)習(xí)和圖像處理,face_recognition人臉識別,采樣、變換和卷積處理,圖像增強(qiáng),圖像特征提取,圖像分割,目標(biāo)檢測,圖像分類,國內(nèi)常用的第三方人臉識別平臺,斗轉(zhuǎn)星移換圖系統(tǒng),智能OCR文本檢測識別系統(tǒng)等內(nèi)容。本書語言簡潔而不失技術(shù)深度,內(nèi)容全面。《基于深度學(xué)習(xí)的圖像處理與實(shí)踐》適用于已經(jīng)了解了Python語言基礎(chǔ)語法,想進(jìn)一步學(xué)習(xí)機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、計(jì)算機(jī)視覺與圖像處理技術(shù)的讀者,還可以作為大專院校相關(guān)專業(yè)的師生用書和培訓(xùn)機(jī)構(gòu)的專業(yè)性教材。
圖像處理作為人工智能領(lǐng)域的重要分支,正在給我們的世界帶來翻天覆地的變化。而在深度學(xué)習(xí)的引領(lǐng)下,圖像處理技術(shù)正迎來全面升級!《基于深度學(xué)習(xí)的圖像處理與實(shí)踐》將帶您進(jìn)入圖像視覺技術(shù)的精彩世界,從基本概念一直深入到高級應(yīng)用,涵蓋了圖像處理、圖像增強(qiáng)、目標(biāo)檢測、人臉識別等多個(gè)方面。無論是初學(xué)者,還是有一定基礎(chǔ)的讀者,都可以通過本書逐步掌握圖像處理與分析的核心技術(shù)。讓您不僅能夠掌握基本原理,更能夠運(yùn)用于實(shí)際項(xiàng)目中。《基于深度學(xué)習(xí)的圖像處理與實(shí)踐》還為讀者提供了豐富的學(xué)習(xí)資源,主要有視頻講解、PPT課件,以及書中案例源代碼,可通過掃描書中二維碼獲取。
當(dāng)我們回顧人類歷史的發(fā)展歷程時(shí)會發(fā)現(xiàn),圖像一直是信息傳遞和交流的重要媒介之一。從古代的壁畫和雕刻,到現(xiàn)代的攝影、電影和數(shù)字圖像,圖像在記錄時(shí)代變遷、傳遞情感、展示美好瞬間和實(shí)現(xiàn)創(chuàng)意方面都扮演著不可或缺的角色。然而,隨著科技的進(jìn)步,我們邁入了一個(gè)全新的數(shù)字時(shí)代,圖像的處理和分析也變得日益重要。本書將帶領(lǐng)讀者進(jìn)入智能圖像處理技術(shù)的精彩世界,從基本概念到高級應(yīng)用,覆蓋了圖像處理、圖像增強(qiáng)、目標(biāo)檢測、人臉識別等多個(gè)方面。無論是計(jì)算機(jī)視覺領(lǐng)域的初學(xué)者還是有一定基礎(chǔ)的讀者,都可以通過本書逐步掌握圖像處理與分析的核心技能。本書特色本書通過深入的內(nèi)容講解、豐富的案例和實(shí)用的教程,為讀者提供了一個(gè)深入了解圖像處理和光學(xué)字符識別(OCR)技術(shù),并將其應(yīng)用于實(shí)際項(xiàng)目的機(jī)會。無論是計(jì)算機(jī)視覺領(lǐng)域的初學(xué)者還是有經(jīng)驗(yàn)的開發(fā)者,都可以從本書中獲得有價(jià)值的知識和經(jīng)驗(yàn)。本書的主要特色如下。1. 廣泛涵蓋計(jì)算機(jī)視覺領(lǐng)域本書涵蓋了計(jì)算機(jī)視覺領(lǐng)域不同方向的兩個(gè)關(guān)鍵主題,即圖像處理和OCR,這使讀者能夠獲得多個(gè)領(lǐng)域的實(shí)際應(yīng)用知識。2. 深入而實(shí)用的內(nèi)容本書的每個(gè)章節(jié)都深入探討了具體技術(shù)的背景、原理和實(shí)現(xiàn)方式,使讀者不僅了解理論,還能夠親自動(dòng)手實(shí)現(xiàn)這些技術(shù)。這種實(shí)踐性的內(nèi)容有助于讀者將知識應(yīng)用于實(shí)際項(xiàng)目。3. 豐富的案例和示例本書的每章都有豐富的案例和示例,這些案例和示例都是從實(shí)際項(xiàng)目中抽取的,涵蓋了不同層面的技術(shù)細(xì)節(jié)和應(yīng)用場景,能幫助讀者更好地理解和應(yīng)用所學(xué)內(nèi)容。4. 結(jié)合多種技術(shù)棧本書不拘泥于單一技術(shù)棧,而是結(jié)合了多種流行的工具和框架,如Python、PyTorch、TensorFlow、OpenCV等,讓讀者能夠在實(shí)際項(xiàng)目中根據(jù)需求選擇合適的工具。5. 詳細(xì)的步驟和教程本書的每個(gè)章節(jié)都提供了詳細(xì)的步驟和教程,從環(huán)境搭建到模型訓(xùn)練再到應(yīng)用開發(fā),讀者可以一步步地跟隨指導(dǎo)完成項(xiàng)目。6. 涵蓋了最新技術(shù)本書反映了最新的技術(shù)演進(jìn)趨勢,如深度學(xué)習(xí)在圖像處理和OCR中的應(yīng)用,以及移動(dòng)端應(yīng)用的開發(fā)等,使讀者能夠跟上領(lǐng)域內(nèi)的最新發(fā)展趨勢。7. 強(qiáng)調(diào)實(shí)際問題解決本書的重點(diǎn)是如何解決實(shí)際問題,每個(gè)章節(jié)都圍繞實(shí)際應(yīng)用場景展開討論,幫助讀者更好地理解如何將技術(shù)應(yīng)用于解決實(shí)際問題。8. 提供線上技術(shù)支持本書正文的每一個(gè)二級標(biāo)題右側(cè)都有一個(gè)二維碼,讀者可通過掃描二維碼觀看視頻講解。除了線上視頻講解以外,本書還為讀者提供了全書案例源代碼和PPT課件,讀者可掃描下方二維碼獲取。
此外,本書還提供在線技術(shù)支持,如果讀者在學(xué)習(xí)中遇到問題,可以向我們的售后團(tuán)隊(duì)求助,求助方式見PPT。本書適合誰看軟件工程師。人工智能開發(fā)工程師。機(jī)器學(xué)習(xí)和深度學(xué)習(xí)開發(fā)人員。計(jì)算機(jī)視覺開發(fā)人員。致謝本書在編寫過程中,得到了清華大學(xué)出版社各位專業(yè)編輯的大力支持,正是各位專業(yè)人士的求實(shí)、認(rèn)真,才使得本書出版。另外,也十分感謝我的家人給予的巨大支持。由于本人水平有限,書中難免存在紕漏之處,懇請讀者提出寶貴的意見或建議,以便更正修訂。最后感謝您購買本書,希望本書能成為您編程路上的領(lǐng)航者,祝您閱讀愉快!
編 者
王卓,華中科技大學(xué)計(jì)算機(jī)碩士。從事深度學(xué)習(xí)相關(guān)工作,擅長前沿人工智能算法的原理分析和應(yīng)用落地,擅長計(jì)算機(jī)視覺、自然語言處理等方向的技術(shù), 先后參與并負(fù)責(zé)了多個(gè)深度學(xué)習(xí)算法在不同場景的業(yè)務(wù)落地。目前主要負(fù)責(zé)電商場景下預(yù)訓(xùn)練語言模型的研發(fā)以及輿情風(fēng)險(xiǎn)的智能識別與治理。
第1章 圖像識別技術(shù)基礎(chǔ) 11.1 圖像識別概述 21.1.1 什么是圖像識別 21.1.2 圖像識別的發(fā)展階段 21.1.3 圖像識別的應(yīng)用 31.2 圖像識別的過程 41.3 圖像識別技術(shù) 41.3.1 人工智能 51.3.2 機(jī)器學(xué)習(xí) 51.3.3 深度學(xué)習(xí) 61.3.4 基于神經(jīng)網(wǎng)絡(luò)的圖像識別 61.3.5 基于非線性降維的圖像識別 7第2章 scikit-image數(shù)字圖像處理 92.1 scikit-image基礎(chǔ) 102.1.1 安裝scikit-image 102.1.2 scikit-image中的模塊 102.2 顯示圖像 112.2.1 使用skimage讀入并顯示外部圖像 112.2.2 讀取并顯示外部灰度圖像 122.2.3 讀取并顯示內(nèi)置星空圖片 132.2.4 讀取并保存內(nèi)置星空圖片 142.3 常見的圖像操作 142.3.1 對內(nèi)置圖片進(jìn)行二值化操作 152.3.2 對內(nèi)置圖片進(jìn)行裁剪處理 162.3.3 將RGB圖轉(zhuǎn)換為灰度圖 172.3.4 使用skimage實(shí)現(xiàn)繪制圖片功能 182.3.5 使用subplot()函數(shù)繪制多視圖窗口 192.3.6 改變指定圖片的大小 212.3.7 使用函數(shù)rescale()縮放圖片 222.3.8 使用函數(shù)rotate()旋轉(zhuǎn)圖片 22第3章 OpenCV圖像視覺處理 253.1 OpenCV基礎(chǔ) 263.1.1 OpenCV和OpenCV-Python介紹 263.1.2 安裝OpenCV-Python 263.2 OpenCV-Python圖像操作 273.2.1 讀取并顯示圖像 273.2.2 保存圖像 293.2.3 在Matplotlib中顯示圖像 303.2.4 繪圖 313.2.5 將鼠標(biāo)作為畫筆 343.2.6 調(diào)色板程序 363.2.7 基本的屬性操作 373.3 OpenCV-Python視頻操作 403.3.1 讀取視頻 403.3.2 播放視頻 413.3.3 保存視頻 423.3.4 改變顏色空間 433.3.5 視頻的背景分離 45第4章 dlib機(jī)器學(xué)習(xí)和圖像處理 494.1 dlib介紹 504.2 dlib基本的人臉檢測 504.2.1 人臉檢測 504.2.2 使用命令行進(jìn)行人臉識別 524.2.3 檢測人臉關(guān)鍵點(diǎn) 544.2.4 基于CNN的人臉檢測器 564.2.5 在攝像頭中識別人臉 584.2.6 人臉識別驗(yàn)證 594.2.7 全局優(yōu)化 604.2.8 人臉聚類 624.2.9 抖動(dòng)采樣和增強(qiáng) 644.2.10 人臉和姿勢采集 654.2.11 物體追蹤 664.3 SVM分類算法 674.3.1 二進(jìn)制SVM分類器 684.3.2 Ranking SVM算法 694.3.3 Struct SVM多分類器 724.4 自訓(xùn)練模型 754.4.1 訓(xùn)練自己的模型 754.4.2 自制對象檢測器 78第5章 face_recognition人臉識別 835.1 安裝face_recognition 845.2 實(shí)現(xiàn)基本的人臉檢測 845.2.1 輸出顯示指定人像人臉特征 845.2.2 在指定照片中識別標(biāo)記出人臉 865.2.3 識別出照片中的所有人臉 885.2.4 判斷照片中是否包含某個(gè)人 915.2.5 識別出照片中的人是誰 925.2.6 攝像頭實(shí)時(shí)識別 935.3 深入face_recognition人臉檢測 985.3.1 檢測用戶眼睛的狀態(tài) 995.3.2 模糊處理人臉 1015.3.3 檢測兩個(gè)人臉是否匹配 1025.3.4 識別視頻中的人臉 1035.3.5 網(wǎng)頁版人臉識別器 106第6章 采樣、變換和卷積處理 1096.1 采樣 1106.1.1 最近鄰插值采樣 1106.1.2 雙線性插值 1126.1.3 雙立方插值 1166.1.4 Lanczos插值 1186.2 離散傅里葉變換 1196.2.1 為什么使用DFT 1196.2.2 用庫NumPy實(shí)現(xiàn)DFT 1206.2.3 用庫SciPy實(shí)現(xiàn)DFT 1216.2.4 用快速傅里葉變換算法計(jì)算DFT 1226.3 卷積 1246.3.1 為什么需要卷積圖像 1246.3.2 使用庫SciPy中的函數(shù)convolve2d()進(jìn)行卷積 1246.3.3 使用庫SciPy中的函數(shù)ndimage.convolve()進(jìn)行卷積 1266.4 頻域?yàn)V波 1286.4.1 什么是濾波器 1286.4.2 高通濾波器 1286.4.3 低通濾波器 1306.4.4 DoG 帶通濾波器 1306.4.5 帶阻濾波器 132第7章 圖像增強(qiáng) 1357.1 對比度增強(qiáng) 1367.1.1 直方圖均衡化 1367.1.2 自適應(yīng)直方圖均衡化 1387.1.3 對比度拉伸 1407.1.4 非線性對比度增強(qiáng) 1427.2 銳化 1447.2.1 銳化濾波 1457.2.2 高頻強(qiáng)調(diào)濾波 1487.2.3 基于梯度的銳化 1527.3 減少噪聲 1567.3.1 均值濾波器 1567.3.2 中值濾波器 1587.3.3 高斯濾波器 1587.3.4 雙邊濾波器 1597.3.5 小波降噪 1607.4 色彩平衡 1617.4.1 白平衡 1617.4.2 顏色校正 1637.4.3 調(diào)整色調(diào)和飽和度 1647.5 超分辨率 1657.6 去除運(yùn)動(dòng)模糊 1677.6.1 邊緣 1677.6.2 逆濾波 1697.6.3 統(tǒng)計(jì)方法 1707.6.4 盲去卷積 171第8章 圖像特征提取 1738.1 圖像特征提取方法 1748.2 顏色特征 1748.2.1 顏色直方圖 1748.2.2 其他顏色特征提取方法 1768.3 紋理特征 1788.3.1 灰度共生矩陣 1788.3.2 方向梯度直方圖 1808.3.3 尺度不變特征變換 1818.3.4 小波變換 1828.4 形狀特征 1848.4.1 邊界描述子 1848.4.2 預(yù)處理后的輪廓特征 1888.4.3 模型擬合方法 1908.4.4 形狀上的變換 1938.5 基于LoG、DoG和DoH的斑點(diǎn)檢測器 1968.5.1 LoG濾波器 1978.5.2 DoG濾波器 1988.5.3 DoH算法 200第9章 圖像分割 2039.1 圖像分割的重要性 2049.2 基于閾值的分割 2049.2.1 灰度閾值分割 2059.2.2 彩色閾值分割 2069.3 基于邊緣的分割 2079.3.1 Canny邊緣檢測 2079.3.2 邊緣連接方法 2089.4 基于區(qū)域的分割 2099.4.1 區(qū)域生長算法 2099.4.2 圖割算法 2129.4.3 基于聚類的分割算法 2139.5 基于圖論的分割 2159.5.1 圖割算法 2159.5.2 最小生成樹算法 2159.6 基于深度學(xué)習(xí)的分割 2179.6.1 FCN 2179.6.2 U-Net 2199.6.3 DeepLab 2209.6.4 Mask R-CNN 220第10章 目標(biāo)檢測 22310.1 目標(biāo)檢測概述 22410.1.1 目標(biāo)檢測的步驟 22410.1.2 目標(biāo)檢測的方法 22410.2 YOLO v5 22510.2.1 YOLO v5的改進(jìn) 22510.2.2 基于YOLO v5的訓(xùn)練、驗(yàn)證和預(yù)測 22610.3 語義分割 24210.3.1 什么是語義分割 24210.3.2 DeepLab語義分割 24410.4 SSD目標(biāo)檢測 24510.4.1 攝像頭目標(biāo)檢測 24610.4.2 基于圖像的目標(biāo)檢測 247第11章 圖像分類 24911.1 圖像分類介紹 25011.2 基于特征提取和機(jī)器學(xué)習(xí)的圖像分類 25011.2.1 圖像分類的基本流程 25011.2.2 基于scikit-learn機(jī)器學(xué)習(xí)的圖像分類 25111.2.3 分類算法 25411.2.4 聚類算法 25711.3 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類 25911.3.1 卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu) 25911.3.2 第一個(gè)卷積神經(jīng)網(wǎng)絡(luò)程序 26211.3.3 使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像分類 26711.4 基于遷移學(xué)習(xí)的圖像分類 27911.4.1 遷移學(xué)習(xí)介紹 27911.4.2 基于遷移學(xué)習(xí)的圖片分類器 28011.5 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的圖像分類 28411.5.1 循環(huán)神經(jīng)網(wǎng)絡(luò)介紹 28411.5.2 實(shí)戰(zhàn)演練 28511.6 基于卷積循環(huán)神經(jīng)網(wǎng)絡(luò)的圖像分類 28611.6.1 卷積循環(huán)神經(jīng)網(wǎng)絡(luò)介紹 28611.6.2 CRNN圖像識別器 287第12章 國內(nèi)常用的第三方人臉識別平臺 29112.1 百度AI開放平臺 29212.1.1 百度AI開放平臺介紹 29212.1.2 使用百度AI之前的準(zhǔn)備工作 29212.1.3 基于百度AI平臺的人臉識別 29612.2 科大訊飛AI開放平臺 30112.2.1 科大訊飛AI開放平臺介紹 30112.2.2 申請?jiān)囉?30112.2.3 基于科大訊飛AI的人臉識別 302第13章 斗轉(zhuǎn)星移換圖系統(tǒng) 31113.1 背景介紹 31213.1.1 CycleGAN的作用 31213.1.2 CycleGAN的原理 31213.2 系統(tǒng)模塊架構(gòu) 31313.3 設(shè)置數(shù)據(jù)集 31313.4 訓(xùn)練數(shù)據(jù) 31513.4.1 加載圖像 31513.4.2 輔助功能 31613.4.3 生成對抗網(wǎng)絡(luò)模型 31913.4.4 訓(xùn)練CycleGAN模型 32213.5 圖像轉(zhuǎn)換 32613.6 調(diào)試運(yùn)行 328第14章 智能OCR文本檢測識別系統(tǒng) 33314.1 OCR系統(tǒng)介紹 33414.1.1 OCR的基本原理和方式 33414.1.2 深度學(xué)習(xí)對OCR的影響 33514.1.3 與OCR相關(guān)的深度學(xué)習(xí)技術(shù) 33514.2 OCR項(xiàng)目介紹 33614.3 準(zhǔn)備模型 33714.3.1 文本檢測模型 33714.3.2 文本識別模型 33714.4 創(chuàng)建工程 33714.4.1 工程配置 33814.4.2 配置應(yīng)用程序 33814.4.3 導(dǎo)入模型 33814.5 具體實(shí)現(xiàn) 33914.5.1 頁面布局 33914.5.2 實(shí)現(xiàn)主Activity 33914.5.3 圖像操作 34314.5.4 運(yùn)行OCR模型 34714.6 調(diào)試運(yùn)行 354