主要介紹了數(shù)字圖像處理的基礎(chǔ)知識、基本方法、程序?qū)崿F(xiàn)和典型應(yīng)用。全書分三大部分共12章。第一部分(第1~4章)介紹數(shù)字圖像處理的基礎(chǔ)知識,包括圖像的基本概念、數(shù)字圖像的輸入輸出、基本運算、圖像變換。第二部分(第5~8章)介紹數(shù)字圖像處理的各種技術(shù),包括圖像增強、圖像復(fù)原、圖像壓縮、圖像分割。第三部分(第9~12章)介紹數(shù)字圖像處理擴展內(nèi)容,主要為研究生學(xué)習(xí)的內(nèi)容,包括圖像特征表示與描述、小波變換和多分辨率處理、彩色圖像處理,圖像通信。
以實踐為導(dǎo)向,介紹數(shù)字圖像處理的基本概念和基礎(chǔ)知識,包括圖像變換、圖像增強、圖像復(fù)原、圖像壓縮、圖像分割、圖像特征表示與描述、小波變換、彩色圖像處理和圖像通信等。書中特別注重采用MATLAB軟件編程實現(xiàn)一些典型算法,使讀者能夠深刻理解和掌握相關(guān)理論與方法。為配合教師教學(xué),幫助學(xué)生學(xué)習(xí),還編寫了與《數(shù)字圖像處理及MATLAB實現(xiàn)》配套的《數(shù)字圖像處理及MATLAB實現(xiàn)——學(xué)習(xí)與實驗指導(dǎo)》,概括教材各章知識要點,給出了書中習(xí)題和思考題的參考解答,以幫助學(xué)生實踐鍛煉。
《數(shù)字圖像處理及MATLAB實現(xiàn)》可作為普通高等院校電子信息、計算機科學(xué)與技術(shù)、通信工程、電氣工程及其自動化等相關(guān)專業(yè)本科生的教材,也可作為從事圖像處理與分析、模式識別、人工智能和計算機應(yīng)用研究和開發(fā)的工程技術(shù)人員的參考書。
《數(shù)字圖像處理及MATLAB實現(xiàn)》特色
系統(tǒng)性強,從問題背景的引入開始,講述基本內(nèi)容和方法,通過MATLAB編程實踐,進行結(jié)果分析。重點突出,理論、應(yīng)用與實際編程緊密結(jié)合,理論與實例并重。每章標題均包含中英文對照,能滿足雙語教學(xué)的部分要求和對本課程專業(yè)英語詞匯的學(xué)習(xí)。
前言/序言
近幾十年來,由于大規(guī)模集成電路技術(shù)和計算機技術(shù)的迅猛發(fā)展、離散數(shù)學(xué)理論的創(chuàng)立和完善,數(shù)字圖像處理技術(shù)正逐漸成為其他科學(xué)技術(shù)領(lǐng)域中不可缺少的一項重要工具。數(shù)字圖像處理技術(shù)也從空間探索到微觀研究、從軍事領(lǐng)域到工農(nóng)業(yè)生產(chǎn)、從科學(xué)教育到娛樂游戲等越來越多的領(lǐng)域得到廣泛應(yīng)用。
針對數(shù)字圖像處理課程概念多,內(nèi)容抽象,讀者入門較難的特點,本書以實踐為導(dǎo)向,以實際應(yīng)用為目標來介紹數(shù)字圖像處理的基本概念和基礎(chǔ)知識。數(shù)字圖像處理主要研究內(nèi)容包括圖像變換、圖像增強、圖像復(fù)原、圖像壓縮、圖像分割等,它是一門實用而綜合性的邊緣學(xué)科。本書在介紹數(shù)字圖像處理技術(shù)基礎(chǔ)理論及算法原理的同時,還特別注意如何用MATLAB軟件編程實現(xiàn)一些常用的圖像處理的典型算法,使讀者能夠深刻理解和掌握圖像處理的理論和方法,并注重實際應(yīng)用。
本書每章附有習(xí)題,幫助讀者鞏固所學(xué)的知識點;我們還編寫了與本書配套的《數(shù)字圖像處理及MATLAB實現(xiàn)—學(xué)習(xí)與實驗指導(dǎo)》,便于讀者學(xué)習(xí)和上機實驗;另配有電子教案光盤,便于教師的教學(xué)和學(xué)生的自學(xué)。
本書第1、2章由楊杰編寫,第3、4章由李慶編寫,第5、6章由鄭林編寫,第8、11章由王昱編寫,第9、10章由黃朝兵編寫,第7、12章由聶明新和許建霞編寫。全書由楊杰統(tǒng)稿,黃朝兵和李慶對部分章節(jié)程序進行了整理。另外,李俊鶴、熊瑋佳、鐘琴、董天昳等參加了部分文字的輸入、程序調(diào)試、插圖和校對工作。在編寫本書過程中參考了大量的圖像處理文獻,作者對這些文獻的作者表示真誠的感謝。
本書的編寫得到武漢理工大學(xué)信息工程學(xué)院的大力支持,作者在此表示衷心感謝。
由于作者水平有限,書中難免存在缺點和疏漏之處,懇請讀者批評指正。
第1章 概述 1
1.1 數(shù)字圖像處理及特點(Characteristics and Processing of Digital Image) 1
1.1.1 數(shù)字圖像與數(shù)字圖像處理(Digital Images and Digital Image Processing) 1
1.1.2 數(shù)字圖像處理的特點(Characteristics of Digital Images) 2
1.2 數(shù)字圖像處理系統(tǒng)(System of Digital Image Processing) 3
1.2.1 數(shù)字圖像處理系統(tǒng)的結(jié)構(gòu)(Structure of Digital Image Processing System) 3
1.2.2 數(shù)字圖像處理的優(yōu)點(Advantages of Digital Image Processing) 4
1.3 數(shù)字圖像處理的主要研究內(nèi)容(Research contents in Digital Image Processing) 5
1.4 數(shù)字圖像處理的應(yīng)用和發(fā)展(Applications and Development of Digital Image Processing) 6
1.4.1 數(shù)字圖像處理的應(yīng)用(Applications of Digital Image Processing) 6
1.4.2 數(shù)字圖像處理領(lǐng)域的發(fā)展動向(Future Direction in the Field of Digital Image Processing) 11
1.5 全書內(nèi)容簡介(Brief Introduction of This Book) 11
小結(jié)(Summary) 12
習(xí)題(Exercises) 13
第2章 數(shù)字圖像處理的基礎(chǔ) 14
2.1 人類的視覺感知系統(tǒng)(Visual System of Human Beings) 14
2.1.1 視覺系統(tǒng)的基本構(gòu)造(Basic Structure of Visual System) 14
2.1.2 亮度適應(yīng)和鑒別(Intensity Adaption and Identification) 16
2.2 數(shù)字圖像的基礎(chǔ)知識(Basics of Digital Image) 19
2.2.1 圖像的數(shù)字化及表達(Image Digitalization and Representation) 19
2.2.2 圖像的獲取(Image Acquisition) 20
2.2.3 像素間的基本關(guān)系(Basic Relationships between Pixels) 23
2.2.4 圖像的分類(Image Classification) 25
小結(jié)(Summary) 29
習(xí)題(Exercises) 29
第3章 圖像基本運算 30
3.1 概述(Introduction) 30
3.2 點運算(Point Operation) 30
3.2.1 線性點運算(Linear Point Operation) 31
3.2.2 非線性點運算(Non-Linear Point Operation) 31
3.3 代數(shù)運算與邏輯運算(Algebra and Logical Operation) 33
3.3.1 加法運算(Addition) 33
3.3.2 減法運算(Subtraction) 35
3.3.3 乘法運算(Multiplication) 36
3.3.4 除法運算(Division) 37
3.3.5 邏輯運算(Logical Operation) 38
3.4 幾何運算(Geometric Operation) 39
3.4.1 圖像的平移(Image Translation) 40
3.4.2 圖像的鏡像(Image Mirror) 41
3.4.3 圖像的旋轉(zhuǎn)(Image Rotation) 42
3.4.4 圖像的縮放(Image Zoom) 44
3.4.5 灰度重采樣(Gray Resampling) 47
小結(jié)(Summary) 49
習(xí)題(Exercises) 50
第4章 圖像變換 51
4.1 連續(xù)傅里葉變換(Continuous Fourier Transform) 51
4.2 離散傅里葉變換(Discrete Fourier Transformation) 52
4.3 快速傅里葉變換(Fast Fourier Transform) 54
4.4 傅里葉變換的性質(zhì)(Characleristics of Fourier Transform) 56
4.4.1 可分離性(Divisibility) 56
4.4.2 平移性質(zhì)(Translation) 56
4.4.3 周期性和共軛對稱性(Periodicity and Symmetry) 57
4.4.4 旋轉(zhuǎn)性質(zhì)(Gyration) 57
4.4.5 分配律(Distribution Law) 58
4.4.6 尺度變換(Scale Variation) 58
4.4.7 平均值(Average Value) 60
4.4.8 卷積定理(Convolution Theorem) 61
4.5 圖像傅里葉變換實例(Examples of Fourier Transform Images) 61
4.6 其他離散變換(Other Discrete Transform) 65
4.6.1 離散余弦變換(Discrete Cosine Transform) 66
4.6.2 沃爾什變換(Walsh Transform) 68
小結(jié)(Summary) 70
習(xí)題(Exercises) 70
第5章 圖像增強 72
5.1 圖像增強的概念和分類(Concepts and Categories of Image Enhancement) 72
5.2 空間域增強技術(shù)(Image Enhancement in the Spatial Domain) 73
5.2.1 基于灰度變換的圖像增強(Image Enhancement based on Gray Levels) 73
5.2.2 基于直方圖處理的圖像增強(Image Enhancement based on Histogram Processing) 76
5.2.3 空間域濾波增強(Spatial Filtering Enhancement) 81
5.3 頻率域增強技術(shù)(Image Enhancement in the Frequency Domain) 88
5.3.1 頻率域增強基本理論(Fundementals of Image Enhancement in the Frequency Domain) 88
5.3.2 頻率域平滑濾波器(Frequency Smoothing Filters) 89
5.3.3 頻率域銳化濾波器(Frequency Sharpening Filters) 92
5.3.4 同態(tài)濾波器(Homomorphic Filters) 94
小結(jié)(Summary) 96
習(xí)題(Excercises) 96
第6章 圖像復(fù)原 98
6.1 退化模型及復(fù)原技術(shù)基礎(chǔ)(Fundamentals of Image Restoration and Degradation Model) 98
6.1.1 圖像退化的原因及退化模型(Causes of Image Degradation and Degradation Model) 99
6.1.2 復(fù)原技術(shù)的概念及分類(Concepts and Categories of Restoration) 100
6.2 空間域濾波復(fù)原(Restoration with Spatial Filtering) 101
6.2.1 均值濾波(Mean Filters) 103
6.2.2 順序統(tǒng)計濾波(Order-Statistics Filters) 105
6.3 頻率域濾波恢復(fù)(Restoration with Frequency Domain Filtering) 107
6.3.1 帶阻濾波器(Bandreject Filters) 107
6.3.2 帶通濾波器(Bandpass Filters) 109
6.3.3 其他頻率域濾波器(Other Filters in Frequency Domain) 109
6.4 逆濾波(Inverse Filtering) 110
6.5 最小均方誤差濾波-維納濾波(Minimum Mean Square Error Filtering-Wiener Filtering) 112
小結(jié)(Summary) 115
習(xí)題(Exercises) 115
第7章 圖像壓縮編碼 117
7.1 概述(Introduction) 117
7.1.1 圖像的信息量與信息熵(Information Content and Entropy) 117
7.1.2 圖像數(shù)據(jù)冗余(Image Data Redundancy) 119
7.1.3 圖像壓縮編碼分類(Coding methods of Image Compression) 121
7.1.4 壓縮技術(shù)的性能指標(Evaluation Index of Image Compression approaches) 121
7.2 無失真圖像壓縮編碼(Lossless Image Compression) 123
7.2.1 哈夫曼編碼(Huffman Coding) 123
7.2.2 游程編碼(Run-Length Coding) 125
7.2.3 算術(shù)編碼(Arithmetic Coding) 127
7.3 有限失真圖像壓縮編碼(Lossy Image Compression) 129
7.3.1 率失真函數(shù)(Rate Distortion Function) 130
7.3.2 線性預(yù)測編碼和變換編碼(Linear Prediction and Transform Coding) 131
7.3.3 矢量量化編碼(Vector Quantifiation Coding) 138
7.4 圖像編碼新技術(shù)(New Image Coding Technology) 140
7.4.1 子帶編碼(Subband Coding) 140
7.4.2 模型基編碼(Model-Based Coding) 141
7.4.3 分形編碼(Fractal Coding) 142
7.5 圖像壓縮技術(shù)標準(Image Compression Standards) 142
7.5.1 JPEG壓縮(JPEG Compression) 142
7.5.2 JPEG 2000 143
7.5.3 H.26X標準(H.26X Standards) 145
7.5.4 MPEG標準(MPEG Standards) 145
小結(jié)(Summary) 145
習(xí)題(Exercises) 146
第8章 圖像分割 147
8.1 圖像分割的定義(Definition of Image Segmentation) 147
8.2 閾值分割(Image Segmentation using Threshold) 148
8.2.1 全局閾值(Global Threshold) 148
8.2.2 自適應(yīng)閾值(Automatic Threshold) 148
8.2.3 最佳閾值的選擇(Optimal Threshold) 148
8.2.4 分水嶺算法(Watershed Algorithm) 152
8.3 邊緣檢測和連接(Edge Detection and Connection) 154
8.3.1 邊緣檢測(Edge Detection) 154
8.3.2 邊緣連接(Edge Connection) 158
8.4 區(qū)域分割(Region Segmentation) 160
8.4.1 區(qū)域增長(Region Growing) 160
8.4.2 區(qū)域分裂法(Region Splitting) 162
8.4.3 區(qū)域合并法(Region Merging) 163
8.4.4 區(qū)域分裂合并法(Region Splitting and Merging) 163
8.5 二值圖像處理(Binary Image Processing) 164
8.5.1 數(shù)學(xué)形態(tài)學(xué)圖像處理(Mathematical Morphology Image Processing) 165
8.5.2 開運算和閉運算(Open Operation and Close Operation) 166
8.5.3 腐蝕和膨脹的變體(Dilation And Erosion Variant) 167
8.6 分割圖像的結(jié)構(gòu)(Construction of Image Segmentation) 169
8.6.1 物體隸屬關(guān)系圖(Relationships between Objects) 169
8.6.2 邊界鏈碼(Edge Chain Code) 169
小結(jié)(Summary) 170
習(xí)題(Exercises) 170
第9章 彩色基礎(chǔ) 172
9.1 彩色基礎(chǔ)(Color Fundamentals) 172
9.2 彩色模型(Color Models) 176
9.2.1 RGB模型(RGB Color Model) 176
9.2.2 HSI模型(HSI Color Model) 179
9.3 偽彩色處理(Pseudocolor Image Processing) 182
9.3.1 強度分層(Intensity Slicing) 182
9.3.2 灰度級到彩色變換(Transformation of Gray Levels to Color) 184
9.4 全彩色圖像處理(Full-Color Image Processing) 186
9.4.1 全彩色圖像處理基礎(chǔ)(Basics of Full-Color Image Processing) 186
9.4.2 彩色圖像直方圖處理(Color Image Histogram Processing) 187
9.4.3 彩色圖像平滑(Color Image Smoothing) 189
9.4.4 彩色圖像銳化(Color Image Sharpening) 191
9.5 彩色圖像分割(Color Image Segmentation) 193
9.5.1 HSI彩色空間分割(Segmentation in HSI Color Space) 193
9.5.2 RGB彩色空間分割(Segmentation in RGB Color Space) 194
9.5.3 彩色邊緣檢測(Color Edge Detection) 196
小結(jié)(Summary) 198
習(xí)題(Exercises) 199
第10章 圖像表示與描述 200
10.1 顏色特征(Characterization of Color Image) 200
10.1.1 灰度特征(Intensity Characterization) 200
10.1.2 直方圖特征(Histogram Characterization) 201
10.2 紋理特征(Representation of Image Texture) 202
10.2.1 自相關(guān)函數(shù)(Autocorrelation Function) 203
10.2.2 灰度差分統(tǒng)計(Statistics of Intensity Difference) 203
10.2.3 灰度共生矩陣(Gray-Level Co-occurrence Matrix) 205
10.2.4 頻譜特征(Spectrum Features) 206
10.3 邊界特征(Boundary Feature) 208
10.3.1 邊界表達(Boundary Representation) 208
10.3.2 邊界特征描述(Boundary Description) 211
10.4 區(qū)域特征(Region Feature) 215
10.4.1 簡單的區(qū)域描述(Some Simple Region Descriptors) 216
10.4.2 拓撲描述(Topological Descriptors) 217
10.4.3 形狀描述(Shape Descriptors) 218
10.4.4 矩(Moment) 219
小結(jié)(Summary) 222
習(xí)題(Exercises) 222
第11章 小波變換 224
11.1 引言(Introduction) 224
11.1.1 加窗傅里葉變換(Adding Windowing Fourier Transform) 224
11.1.2 連續(xù)小波變換(Continuous Wavelet Transform) 225
11.2 離散小波變換(Discrete Wavelet Transform) 226
11.2.1 離散小波變換概述(Introduction of Discrete Wavelet Transform) 226
11.2.2 多分辨分析及Mallat算法(Multi-resolution Analysis And Mallat Algorithm) 227
11.2.3 緊支撐雙正交小波基的構(gòu)造(Compactly Supported Biorthogonal Wavelet) 235
11.3 小波變換在圖像處理中的應(yīng)用(Application of Wavelet in Image Processing) 237
小結(jié)(Summary) 239
習(xí)題(Exercises) 240
第12章 圖像通信 241
12.1 概述(Introduction) 241
12.1.1 圖像通信系統(tǒng)的組成(Image Communication System) 241
12.1.2 數(shù)字圖像通信中的關(guān)鍵技術(shù)(key Technology in Digital Image Communication) 242
12.2 基于IP的圖像通信網(wǎng)絡(luò)(IP-based image communication network) 243
12.2.1 H.323協(xié)議(H.323 Protocol) 243
12.2.2 H.323協(xié)議支持的會議系統(tǒng)(Video Conference Based On H.323 Protocol) 245
12.2.3 SIP及其應(yīng)用(SIP and its Application) 246
12.2.4 H.323和SIP的比較(Comparison between H.323 and SIP) 249
12.3 視頻點播系統(tǒng)(Video-On-Demand) 250
12.3.1 VOD系統(tǒng)的構(gòu)成(Composition of VOD System) 250
12.3.2 VOD的關(guān)鍵技術(shù)(Key Technology of VOD System) 251
12.3.3 基于有線電視網(wǎng)的VOD(VOD over CATV network) 252
12.3.4 基于IP的VOD(VOD over IP) 253
12.4 數(shù)字電視與交互式電視(Digital TV and Interactive TV) 255
12.4.1 數(shù)字電視(Digital TV) 255
12.4.2 交互式電視(Interactive TV) 258
12.5 視頻流媒體技術(shù)(Streaming Media Technology) 260
12.5.1 流媒體基本概念(Basic Concept of Streaming Media) 260
12.5.2 實時傳輸協(xié)議RTP(Real Time Transport Protocol) 261
12.5.3 實時流協(xié)議RTSP(Real Time Streaming Protocol) 261
12.5.4 流媒體文件格式(Format of Streaming Media File) 263
小結(jié)(Summary) 264
習(xí)題(Exercises) 265
參考文獻 266
自20世紀60年代第三代數(shù)字計算機問世以后,數(shù)字圖像處理技術(shù)出現(xiàn)了空前的發(fā)展,其發(fā)展態(tài)勢目前仍方興未艾。在該領(lǐng)域中需進一步研究的問題,主要包括如下5個方面。
(1)在進一步提高精度的同時著重解決處理速度問題。如在航天遙感、氣象云圖處理方面,巨大的數(shù)據(jù)量和處理速度仍然是主要矛盾之一。
(2)加強軟件研究、開發(fā)新的處理方法,特別要注意移植和借鑒其他學(xué)科的技術(shù)和研究成果,創(chuàng)造新的處理方法。
(3)加強邊緣學(xué)科的研究工作,促進圖像處理技術(shù)的發(fā)展。如人的視覺特性、心理學(xué)特性等的研究如果有所突破,將對圖像處理技術(shù)的發(fā)展會有極大的促進作用。
(4)加強理論研究,逐步完善圖像處理科學(xué)自身的理論體系。
(5)建立圖像處理領(lǐng)域的標準化規(guī)范。圖像的信息量大、數(shù)據(jù)量大,圖像信息的建庫、檢索和交流是一個棘手的問題。就現(xiàn)有的情況看,軟件、硬件種類繁多,交流和使用極為不便,這成了資源共享的嚴重障礙。應(yīng)及早建立圖像信息庫,統(tǒng)一存放格式,建立標準子程序,統(tǒng)一檢查方法。
圖像處理技術(shù)未來發(fā)展大致可歸納如下4點。
(1)圖像處理的發(fā)展將向著高速、高分辨率、立體化、多媒體化、智能化和標準化方向發(fā)展。圍繞著HDTV(高清晰度電視)的研制將開展實時圖像處理的理論及技術(shù)研究。
(2)圖像、圖形相結(jié)合朝著三維成像或多維成像的方向發(fā)展。
(3)結(jié)合多媒體技術(shù),硬件芯片越來越多,把圖像處理的眾多功能固化在芯片上將會有更加廣闊的應(yīng)用領(lǐng)域。
(4)在圖像處理領(lǐng)域近年來引入了一些新的理論并提出了一些新的算法,如W>8Lvelet、Fractal、Morpholog卜遺傳算法、神經(jīng)網(wǎng)絡(luò)等。這些理論在未來圖像處理理論與技術(shù)上的作用應(yīng)給予充分的注意,并積極地加以研究。
圖像處理特別是數(shù)字圖像處理科學(xué)經(jīng)初創(chuàng)期、發(fā)展期、普及期及/廣泛應(yīng)用幾個階段,如今已是各個學(xué)科競相研究并在各個領(lǐng)域廣泛應(yīng)用的一門學(xué)科。今天,隨著科技事業(yè)的進步及人類需求的多樣化發(fā)展,多學(xué)科的交叉、融合已是現(xiàn)代科學(xué)發(fā)展的突出特色和必然途徑。