這是一本關于圖像處理基本原理及其具體應用的圖書,是作者多年來教學、科研與應用的總結。全書共15章,內容貫穿從圖像獲取到應用的整個過程,具體包括圖像獲取、人類視覺、打印和存儲、成像缺陷修正、空間域圖像增強、頻率域圖像處理、分割和閾值處理、二值圖像處理、全局圖像測量、特定特征的測量、形狀表征、特征識別與分類、層析成像、三維可視化、表面成像。本書的特色是,著重于各種圖像處理方法的介紹與比較,并使用實例進行演示與說明。
本書是作者50年來在科研、教育和應用領域經驗的總結,適合于讀者自學,是數字圖像處理領域的經典參考圖書。
第1章 獲取圖像 1
1.1 人類依賴圖像來獲取信息 1
1.2 攝像機 3
1.3 CCD相機 4
1.4 相機缺陷與限制 8
1.5 彩色相機 9
1.6 相機分辨率 11
1.7 對焦 12
1.8 電子和帶寬限制 12
1.9 像素 14
1.10 灰度分辨率 16
1.11 噪聲 17
1.12 高深度圖像 18
1.13 彩色成像 21
1.14 數碼相機的局限性 26
1.15 色彩空間 26
1.16 色彩校正 33
1.17 彩色顯示器 35
1.18 圖像類型 36
1.19 距離成像 37
1.20 多幅圖像 42
1.21 體視法 45
1.22 成像需求 50
第2章 人類視覺 55
2.1 我們看到了什么,為什么會看到 55
2.2 識別 57
2.3 技術參數 60
2.4 敏度 63
2.5 眼睛告訴大腦的內容 66
2.6 空間比較 68
2.7 局部到全局層次結構 70
2.8 時間問題 74
2.9 第三維 77
2.10 工作原理與工作內容 79
2.11 看到不存在的東西,反之亦然 80
2.12 圖像壓縮 82
2.13 光的世界 83
2.14 尺寸很重要 85
2.15 形狀 86
2.16 上下文 88
2.17 必須做好布局 89
2.18 眼見為實 91
2.19 結論 92
第3章 打印和存儲 93
3.1 打印 93
3.2 紙張上的點 96
3.3 彩色印刷 98
3.4 印刷硬件 102
3.5 膠片記錄器 105
3.6 其他演示工具 106
3.7 文件存儲 106
3.8 存儲介質 107
3.9 磁性記錄 108
3.10 圖像數據庫 110
3.11 瀏覽和縮略圖 114
3.12 無損編碼 116
3.13 簡化的調色板 120
3.14 JPEG壓縮 121
3.15 小波壓縮 123
3.16 分形壓縮 126
3.17 數字電影 127
第4章 修正成像缺陷 129
4.1 對比度擴展 129
4.2 帶噪圖像 132
4.3 鄰域平均法 135
4.4 鄰域排序 140
4.5 其他鄰域降噪方法 147
4.6 缺陷消除、最大熵和最大似然 151
4.7 非均勻光照 153
4.8 擬合背景函數 155
4.9 排序調勻 159
4.10 彩色圖像 161
4.11 非平面視圖 162
4.12 計算機圖形學 163
4.13 幾何失真 164
4.14 對齊 166
4.15 內插 168
4.16 變形 171
第5章 空間域圖像增強 173
5.1 對比度控制 174
5.2 直方圖均衡 176
5.3 局部均衡 180
5.4 拉普拉斯算子 182
5.5 導數 189
5.6 使用梯度找到邊緣 192
5.7 其他邊緣檢測器 196
5.8 紋理 201
5.9 分形分析 204
5.10 實現說明 204
5.11 圖像數學基礎 205
5.12 減去圖像 206
5.13 相乘和相除 208
5.14 主成分分析 210
5.15 其他圖像組合 213
第6章 頻率空間中的圖像處理 217
6.1 關于頻率空間 217
6.2 傅里葉變換 218
6.3 簡單函數的傅里葉變換 220
6.4 頻率和方向 223
6.5 首選方向 225
6.6 紋理和分形 228
6.7 隔離周期性噪聲 230
6.8 選擇性掩模和濾波器 233
6.9 周期性信息的選擇 235
6.10 卷積 238
6.11 去卷積 240
6.12 噪聲和維納去卷積 243
6.13 模板匹配和相關 248
6.14 自相關 252
第7章 分割和閾值處理 254
7.1 閾值處理 254
7.2 自動設定閾值 256
7.3 多波段圖像 258
7.4 二維閾值 260
7.5 多頻段閾值處理 262
7.6 來自紋理的閾值處理 264
7.7 多個閾值處理標準 266
7.8 紋理方向 267
7.9 區域邊界 270
7.10 條件直方圖 274
7.11 邊界線 276
7.12 輪廓 278
7.13 圖像表示 280
7.14 其他分割方法 282
7.15 一般分類問題 284
第8章 二值圖像處理 286
8.1 布爾運算 286
8.2 組合布爾運算 289
8.3 掩模 291
8.4 從像素到特征 293
8.5 特征的布爾邏輯運算 297
8.6 按位置選取特征 300
8.7 雙閾值處理 304
8.8 腐蝕和膨脹 305
8.9 開運算和閉運算 306
8.10 各向同性 309
8.11 使用腐蝕和膨脹進行測量 311
8.12 擴展到灰度圖像 313
8.13 形態學鄰域參數 314
8.14 應用示例 316
8.15 歐氏距離圖 318
8.16 分水嶺分割 320
8.17 最終的腐蝕點 324
8.18 骨架 326
8.19 邊界線條和加粗 329
8.20 組合骨架和EDM 332
第9章 全局圖像測量 334
9.1 全局測量和體視學 334
9.2 表面積 338
9.3 ASTM顆粒尺寸 341
9.4 多種類型的表面 342
9.5 長度 343
9.6 厚度 345
9.7 采樣策略 346
9.8 確定數量 348
9.9 曲率、連通性和Disector 350
9.10 各向異性和梯度 352
9.11 顆粒尺寸 355
9.12 經典體視學(展開) 356
第10章 特定特征的測量 359
10.1 亮度測量 359
10.2 確定位置 365
10.3 方向 367
10.4 相鄰關系 369
10.5 對齊 372
10.6 計數 378
10.7 特殊的計數過程 381
10.8 特征尺寸 384
10.9 圓和橢圓 386
10.10 卡尺維度 387
10.11 周長 389
第11章 形狀表征 392
11.1 描述形狀 392
11.2 無量綱比 393
11.3 分形維數 397
11.4 諧波分析 401
11.5 拓撲學 408
11.6 三維 410
第12章 特征識別與分類 413
12.1 模板匹配和互相關 413
12.2 參數描述 415
12.3 決策點 420
12.4 多維分類 421
12.5 學習系統 427
12.6 kNN和聚類分析 431
12.7 專家系統 433
12.8 神經網絡 435
12.9 語法模型 436
第13章 層析成像 438
13.1 多維情形 438
13.2 體積成像與截面 442
13.3 重建的基礎 445
13.4 代數重建方法 449
13.5 最大熵 451
13.6 重建圖像中的缺陷 452
13.7 射束硬化 455
13.8 成像幾何 459
13.9 三維斷層成像 462
13.10 高分辨率斷層成像 466
第14章 三維視圖 470
14.1 三維數據源 470
14.2 連續切片 471
14.3 光學切片 474
14.4 連續移除 475
14.5 立體測量 477
14.6 三維數據集 479
14.7 對數據集切片 481
14.8 任意剖面 484
14.9 色彩的運用 486
14.10 立體顯示 487
14.11 立體觀看 489
14.12 專用顯示硬件 491
14.13 射線追蹤 493
14.14 反射 496
14.15 表面 499
14.16 多連通表面 502
14.17 三維空間中的圖像處理 506
14.18 三維圖像測量 508
第15章 表面成像 511
15.1 生成表面 511
15.2 物理接觸表面成像 512
15.3 非接觸測量 515
15.4 表面的顯微鏡檢查 518
15.5 表面成分成像 520
15.6 距離圖像處理 521
15.7 成分圖處理 523
15.8 數據呈現與可視化 524
15.9 渲染和可視化 528
15.10 表面數據分析 531
15.11 剖面測量 532
15.12 伯明翰測量套件 535
15.13 地形分析和分形維數 539
參考文獻 544
本書特色
(1)按照從獲取到解釋的順序,給出了各種圖像處理與分析的方法,并對不同方法進行了比較。
(2)介紹了改善圖像外觀、打印效果和傳送效率的方法。
(3)講解了準備圖像來測量特征和結構的過程。
(4)詳述了隔離結構進而測量其大小、形狀、顏色和位置的方法。
(5)介紹了校正圖像缺陷與各種限制的方法。
(6)說明了增強可視內容和解釋細節的方法。
(7)采用體視學方法介紹了測量結構的方法。
(8)應用統計方法進行分類和識別。
譯 者 序
圖像處理是對圖像信息進行加工以滿足人的視覺心理或應用需求的行為。圖像作為人類感知世界的視覺基礎,是人類獲取、表達和傳遞信息的重要手段。
John C. Russ教授所著的本書在美國已出版了六版,受到了讀者的一致肯定。盡管國內已引進了Castleman、Gonzalez、Pratt等學者的圖像處理書籍,但本書幾乎不用數學公式而盡量用文字和圖例來解釋圖像處理的表達手法,使得其具有非常獨特的特點。應電子工業出版社的邀請,本人有幸將該書翻譯成中文,供廣大國內學者參考。
本書的翻譯延續了本人其他譯著的風格。對于翻譯過程中遇到的疑似錯誤,均以電子郵件的形式與原作者進行了溝通,并得到了作者的及時反饋。由于書中公式少,文字多,涉及的知識跨越多個學科,翻譯難度極大;為力求準確,對于不常見的詞匯,均采用了以英文單詞在中國期刊網搜索關鍵詞的方式進行初譯,再以中文譯名在谷歌等搜索引擎中搜索的方式進行確定。其他一些詞匯則通過查閱廣州圖書館及華南理工大學圖書館館藏的相關書籍進行確定。對于實在無法查到對應中文表達的,則按照本人的理解給出翻譯。即便如此,相信翻譯的錯漏仍在所難免,希望廣大讀者能夠及時指出,以便在之后的重印中糾正。
本書第3章~第5章及第9章~第14章由本人獨立翻譯,其他章節由他人協助本人完成初譯,再由本人整理完成;其中謝元杰和余伯庸參與第1章、第6章及第8章的初譯和后期的校對整理,參與第1章初譯的還有劉寧昊,參與第2章初譯的有岑宣良、藍俊健、黃偉鵬、張志欣及鄭顯華,參與第6章初譯的還有張珂,參與第7章初譯的有岑宣良、蘇茜菲、孫祎楠和陳旭升,參與第8章初譯的還有郭宇隆和朱祖聰,趙恒煜協助進行了第15章的初譯。華南理工大學電子與信息學院楊春玲教授、胡永健教授、王偉凝副教授、周智恒副教授及劉琲貝老師,廈門大學的曾德爐副教授審閱了本書的譯稿。梁宇文同學試讀了本書的部分章節并提出了寶貴的意見。在此一并表示感謝。
譯 者
致 謝
本書中包含的所有圖像處理及結果圖形的創建,均是在蘋果計算機及索尼VAIO計算機上使用Adobe Photoshop CS4和Fovea Pro插件進行的。許多圖像直接取自顯微鏡和直接向計算機提供數字輸出的其他設備。其他圖像則是用各種數碼相機(如索尼、尼康、佳能等)獲得的,有些圖像是使用平板和幻燈片掃描儀(尼康和愛普生)獲取的,大部分圖像由我的同事和其他研究人員提供。無論這些圖像的源頭是否能確定,都在此表示感謝。
本書是以數字形式(存儲在一張可擦寫DVD上)提交給出版商的,并沒有中間的打印稿及圖像的底片或正片等。這意味著作者必須對排字錯誤或圖形問題負全部責任。我已盡最大努力以像素級細節來顯示放大的重要圖像。這一過程也迫使我去了解一些出版技術。無論如何,從磁盤文件直接成書在確保了圖像質量的同時,也縮短了圖書制作的時間并降低了成本。衷心感謝CRC出版公司的編輯對我的培訓并容納書中數量眾多的插圖(超過2000幅圖形和25萬個單詞)。
特別感謝北卡羅來納州Reindeer Graphics公司的Chris Russ先生,他對許多算法進行了編程并給出了寶貴的建議;還要特別感謝Helen Adams女士,她校對了本書中的許多內容,忍受了大量關于有效表達信息方式的討論,并為此書的撰寫計劃得以實現提供了許多支持。
John C. Russ
于美國北卡羅來納州羅利市
序 言
各種應用中因以下兩個稍微不同的目的使用了圖像處理:
⑴改進呈現給人類觀看者的圖像的外觀,包括圖像的印刷與傳輸。
⑵提供圖像,以測量其揭示的特征與結構。
適用于每種任務的技術并非總是相同的,但二者有很大的交疊性。本書將討論對兩種任務都適用的方法。
為使工作盡可能最佳,知道所處理的圖像將用于何處是很重要的。對于視覺增強而言,這意味著要在一定程度上熟悉人類視覺過程,并了解觀察者對圖像中的哪些線索有反應。關于人類視覺的一章涉及了這些問題。由于許多圖像是在復制或傳輸的情況下進行處理的,因此了解圖像的印刷或顯示過程也會很有幫助。隨著數碼相機用戶數量的劇增,圖像的印刷技術發展得非常快,本書提供了最新的相關信息。
圖像測量通常是獲取科學數據的主要方法,而這通常又需要定義明確的特征或結構,它們可以是邊緣、亮度、色彩、紋理或它們的組合。在確定適當的處理步驟時,對整個場景或對每個特征進行何種測量非常重要。書中的幾章詳細探討圖像的測量。盡管人類視覺并不是定量的,且很容易被誤導,但尺寸、位置和亮度的測量涉及人類能大量理解的主題。形狀是更難以理解的一個概念,因此這一版中增加了單獨的一章來總結用數字描述形狀的各種方式。測量的數據可用于目標的分類或識別。書中給出了幾種不同的測量方式,并給出了示例。
類似于食品加工與文字處理,圖像處理并不會減少所呈現的數據量,而只是對其進行重新排列,意識到這一點將會很有幫助。在這種意義上,有些排列可能會更吸引人,有些排列則可能會表達出更多的含義,但這兩個標準可能既不相同,也不會要求相同的方法。
本書介紹了許多圖像處理工具,以便基于計算機系統的用戶既能理解套裝軟件中提供的這些方法,又能為特殊應用的需要編寫程序。通過從各種顯微圖像、肉眼可見圖像、遙感及天文圖像中選取有代表性的圖片,比較了用于相似目的的不同算法。要強調的是,圖像的尺度對所用來處理或分析的技術影響甚微。具有納米級分辨率的顯微鏡與產生光年級圖像的望遠鏡,會生成需要許多相同算法的圖像。
貫穿全書的重點仍然是解釋和演示方法,而不提供大量的數學公式,以便讀者能清晰地理解書中的內容。隨著計算機速度與運算能力的發展,搜索有效性的技巧與近似方法的重要性有所降低,因此基于全精度方法的精確實現的例子通常能在桌面系統上實現。所涉及的主題通常與典型工作流程中方法應用的相同順序呈現。
多年來,在向學生講授這些內容時,我將掌握這些技術比擬為一名熟練的木匠。不同的木工工具(鋸、刨、鉆頭)的數量相對較少,且盡管存在一些變體,如螺絲起子有平口形的也有十字形的等,但知道如何使用每種類型的工具則與完全理解它們緊密相關。使用一組這樣的工具,熟練的木匠可建造出一棟房子、一艘船或一件家具。圖像處理工具同樣如此,它也分為幾種類型,如直方圖修改、鄰域運算、傅里葉空間處理等,可用來實現許多目的。在五金店中購買工具時,并不提供使用這些工具的技巧。理解怎么使用它們需要實踐,從而培養自己預先想象如何使用這些工具的能力。對于圖像處理工具而言,同樣如此。
在為本書修訂這一版時,我也試圖對讀者與審閱者的評論和要求做出回應。在第二版中添加了關于圖像測量及數據解釋的章節,在第三版中添加了關于表面圖像的一節。第四版在三維結構和特征分類的不同邏輯方法幾節中增加了測量的體視學解釋。第五版擴充了關于去卷積、擴展動態范圍圖像和多通道成像以及主成分分析的幾節。在第六版中,添加了關于形狀含義的一章和多維成像的補充內容。在描述日新月異的圖像獲取與打印硬件的章節,添加了最新的硬件和軟件技術內容。
與前幾版一樣,我一直拒絕采納在本書中“添加更多的數學知識”這類建議。對于圖像處理、壓縮、數學形態學等,已有許多優秀的教材,這些教材提供了嚴密且豐富的推導,其中的許多也被本書所引用。但本書的要點仍是采用例子的方式來進行教學。很少有人通過公式學習圖像處理的原理。就像我們用圖像來交流思想與“科學研究”一樣,我們中的多數人使用圖像來了解許多事情,包括成像本身。通過看到并比較不同運算對圖像處理的結果,我們才能發現如何及為何使用這些運算。只有這樣,我們才能更好地理解其數學原理。
對于每個涉及成像的人,尤其是從事科學和取證領域的人而言,一個非常關心的實際問題是正確和適當的處理由什么組成,以及不道德的甚至欺騙性的操作由什么組成。簡短的答案是,更改一幅圖像進而創建就觀察者而言的錯覺的任何手段都是錯誤的。該答案所對應的問題并未考慮不同觀察者可能希望從圖像中看到不同內容這一事實,因此,對某人而言的錯覺,對另一個人可能并非如此。
首要原則總是,要存儲原始圖像及關于其獲取的相關數據的永久副本。次要原則是,要小心地記錄處理圖像的每個步驟,并在發布處理后的圖像時報告這些步驟。多數科技出版物及審閱所提交論文的編輯,近年來更意識到進行圖像處理的容易性與文檔不足的危險性。例如,讀者可參閱M. Rossner和K. M. Yamada的文章(2004;J. Cell Biology)來了解該期刊對于圖像倫理的政策及不正確處理的例子。
根據美國最高法院的Daubert案件[Daubert狀告Merrell Dow制藥有限公司(92-102),509 U.S. 579,1993],出于取證目的,處理人員有責任完整地記錄圖像處理的每個步驟,以確保這些方法能被法庭接受,這通常意味著這些方法不僅廣泛被專業人員接受,而且已被嚴格測試并輸出了想要的結果。在取證環境中,通常需要向非技術性陪審團逐步解釋過程。這通常要求證明從圖像得到的細節確實在原始狀態下是真實存在的,它們只是通過處理在視覺上更加顯而易見。
一些過程,例如對特征重新排列或將它們組合到單幅圖像中,或調整幾幅圖像的對比度以使它們看起來更相像,很明顯是誤導或完全錯誤的。有些過程,例如使用復制-粘貼來復制圖像的一部分,或選擇性地擦除圖像的某些部分,是完全不正當的。即使選擇性地裁剪一幅圖像(或選擇要記錄的范圍)也會讓人們產生錯覺。
基本準則是,對一幅圖像添加任何內容都是不可接受的,但若是使得剩余的細節更易于得到,或形象地用于展示與溝通,或是便于測量,抑制或移除某些信息,則可能是可以接受的。當然,所用的過程必須記錄下來并報告。這里顯示的任何過程可能在特殊情形下是適當的,但它們也可能被誤用,在沒有對其理解與仔細記錄的任何情形下,都不應使用。科學方法的核心是重現性。如果在所應用的處理步驟中提供了足夠的信息,且保留了原始的圖像數據,那么結果的有效性就可被獨立驗證。
重要但經常被忽視的一個要點是,需要避免在用戶沒有意識到的情況下使用程序更改圖像。例如,使用Photoshop仔細地校正一幅圖像的顏色,然后將它放入PowerPoint中演示,即使是在同一臺計算機屏幕上也會導致不同(在轉換過程中使用的復制-粘貼操作同樣會丟棄像素并降低分辨率)。此外,在另一臺計算機顯示器上或使用投影儀時,圖像看上去也會有所不同。將一幅圖像粘貼到Word中會降低圖像的分辨率及彩色或灰度動態范圍。這可能不會影響打印出的文檔,因為打印文檔的色域比計算機屏幕的色域要小,但接下來不能再從打印文檔中恢復出該圖像的原始形式。使用有損壓縮方法(如JPEG)保存一幅圖像時,可能會丟棄重要的信息,且這些信息將不可恢復。
我鼓勵讀者在使用本書的同時,使用真實的圖像源和基于計算機的系統來用不同的方法隨意進行實驗,以確定最適合自己特定需求的方法。在讀者預先不了解相關內容之前,選取圖像處理工具來考察圖像,與那種使用工具來使得圖像更易于被另一位觀看者看出與你已發現的相同內容相比而言,是一件更困難的任務。這需要很快的計算速度和界面的交互特性,尤其要求讀者成為一名非常善于分析的圖像觀察者。如果能學會看出計算機所看到的內容并預估各種算法的結果,那么讀者將成為一名出色的觀察者,并可能獲得適合于進一步處理與分析的最好圖像。
為使得這種親身實踐的學習更加方便,我與我的兒子Chris Russ合作撰寫了本書的配套圖書Introduction to Image Processing and Analysis,該書介紹了如何編寫程序來實現這些算法并創建與Adobe Photoshop兼容的實現這些方法的插件。該書的可下載習題解答適用于使用Macintosh或Windows操作系統的計算機。網站http://www.DrJohnRuss.com上還有下載插件和試用程序包的其他鏈接。
作 者 簡 介
在作為科學家和教育家的50年生涯中,John C. Russ一直使用圖像處理和分析來作為理解和描述材料結構和功能的主要工具。來自各種設備(包括光學和電子顯微鏡、X射線和中子斷層掃描等)的圖像要求計算機處理和測量,以提取重要的數據。Russ的許多研究工作涉及金屬和陶瓷的微觀結構與表面形貌。他的研究與教學獲得了來自政府機關和業界的基金資助。盡管現已退休,但Russ博士目前正協助北卡羅來納州立大學建立新的實驗室和計劃,這將是全美第一家提供取證學與工程高級學位的地方。
對算法與設備的熟悉使得Russ博士的技能擴展到了更為寬泛的圖像領域——從天文學到生物醫學研究,再到食品科學與取證。另外,對于北卡羅來納州立大學工程學院的學生而言,Russ一直是其研究生學術委員會成員,此外還在材質、漿紙產品、獸醫、微生物學、食品科學、考古學等方面與教員們進行協作。向幾千名學生講授原理與方法并向業界客戶提供咨詢,進一步拓寬了Russ博士的經驗及圖像處理與分析的應用范圍。
退休后,Russ博士曾擔任Rank Taylor Hobson這家精密儀器制造商的研究總監。他仍在撰寫圖書并為許多公司提供咨詢(以及刑事與民事案件的專家鑒定),在全球范圍內開辦圖像處理與分析講習班,并審閱出版物和基金申請書。他活躍于美國顯微學會、微束分析學會、國際光學工程學會(SPIE)、國際體視學學會,是定量形態學學會的主席團成員、皇家顯微學會會士,并受這些或其他組織的邀請進行特邀講座與培訓。2006年11月16日,紐約顯微學會因John Russ在顯微領域作為計算機輔助顯微與圖像分析的開發者,而授予他Ernst Abbe紀念獎。