《語音信號處理(C++版)》介紹了語音信號處理的基礎、原理、方法和應用,并且給出一些語音信號處理關鍵算法的C++函數。全書共分12章。第1章介紹了語音信號處理的發展歷程和相關研究方向;第2~4章介紹了語音信號處理的一些基礎理論、方法和參數;第5~12章按語音信號處理的研究方向,分別介紹了語音增強、說話人識別、語音識別、語音信號情感處理、語音合成與轉換、聲源定位、語音隱藏和語音編碼的基礎理論和算法原理。在附錄中,介紹了本書涉及的C++類庫及引入的函數庫,并且以基于Visual Studio的語音錄放程序為例,詳細介紹了基于MFC的語音處理框架及程序實現。
《語音信號處理(C++版)》可作為計算機和通信與信息系統等學科相關專業的高年級本、?茖W生和研究生的教材用書或教學參考用書,也可作為從事語音信號處理的科研工程技術人員的輔助讀物和參考用書。
適讀人群:從事語音信號處理的科研工程技術人員,計算機和通信與信息系統等學科相關專業的高年級本、?茖W生和研究生
《語音信號處理(C++版)》大的特點是在介紹基本理論和基本算法的基礎上,給出部分C++程序實現,使學習人員可以邊學習理論邊實踐。
《語音信號處理(C++版)》還可以配套《語音信號處理實驗教程》(ISBN 978-7-111-53071-8)使用,以方便教師根據不同的學生層次和要求來組織實驗教學,加深學生對知識的理解和掌握。
前言
語音信號處理是以語音語言學和數字信號處理為基礎而形成的一門涉及面很廣的綜合性學科,與心理學、生理學、計算機科學、通信與信息科學以及模式識別和人工智能等學科都有著非常密切的關系。該學科始終與信息科學中最活躍的前沿學科保持密切的聯系,并且一直是數字信號處理技術發展的重要推動力量,從而能夠長期地、深深地吸引廣大科研工作者不斷地進行研究和探討。
《語音信號處理(C++版)》較全面地反映了現代語音信號處理的主要內容和發展方向,主要面向信號與信息處理、電路與系統、通信與電子工程、模式識別與人工智能、計算機信息處理等學科有關專業的高年級本科生和研究生,也可以作為從事語音信號處理這一領域科研工作的技術人員參考書。因此,《語音信號處理(C++版)》在內容上強調基本概念和基本理論方法的掌握,并突出各部分的相互聯系。此外,考慮到語音信號處理的實用性很強,《語音信號處理(C++版)》在介紹基本理論和基本算法的基礎上,給出部分C++程序實現,使學習人員可以邊學習理論邊實踐,有助于知識的理解和記憶。
《語音信號處理(C++版)》的參考學時為本科生32學時、研究生40學時,可以根據不同的教學要求對內容進行適當取舍,靈活安排授課學時數。全書共分為12章,具體內容如下:
第1章簡要介紹了語音信號處理的發展歷程和當前的主要研究方法,以及本書的章節安排情況。
第2章介紹了語音信號處理的基礎知識,包括語音的發音和感知機理、語音信號的數學模型、語音信號的基本參數以及語音的基本表征方法等。
第3章介紹了語音信號的預處理方法(包括分幀與加窗、趨勢項和直流量的消除、預加重和去加重)以及4種語音信號的基本分析方法,包括時域分析、頻域分析、倒譜分析和線性預測分析。
第4章介紹3種語音信號的特征提取技術,包括端點檢測、基音周期估計和共振峰估計。其中,端點檢測算法包括雙門限法、自相關法、譜熵法、比例法和譜距離法;基音周期估計算法包括信號預處理、自相關法、平均幅度差函數法、倒譜法、簡化逆濾波法以及后處理法;共振峰估計算法包括倒譜法和線性預測法。
第5章介紹了語音增強的基本原理和典型算法。首先介紹了語音和噪聲特性、人耳的聲音感知特性和語音質量的評價標準,然后依次介紹4種語音增強算法:譜減法、維納濾波法、自適應濾波器法和基于聽覺掩蔽效應的語音增強方法。
第6章介紹了說話人識別算法。首先介紹了說話人識別的原理及系統結構,然后介紹了兩種典型的說話人識別系統,分別是基于VQ的說話人識別系統和基于GMM的說話人識別系統。最后介紹了說話人識別的研究難點。
第7章介紹了語音識別算法。首先介紹了語音識別基本原理與系統構成,然后介紹了基于動態時間規整的語音識別系統和基于隱馬爾可夫模型的語音識別系統,最后介紹了算法的評測方法。
第8章介紹了語音信號中的情感信息處理的基本原理。首先介紹了情感理論和語音數據庫的建立方法,然后介紹了一些常用的語音情感特征及其提取算法,最后介紹了3種語音情感識別算法,包括K近鄰分類器、支持向量機和人工神經網絡。
第9章介紹了語音合成與轉換的基本原理。首先介紹了幀合成技術,然后介紹了3種語音合成算法,包括線性預測合成法、共振峰合成法和基音同步疊加技術,接著介紹了語音信號的變速和變調的原理和實現方法,最后介紹了語音轉換的基本原理和研究方向。
第10章介紹了聲源定位的基本原理。依次介紹了雙耳聽覺定位原理及方法和3種基于傳聲器陣列的聲源定位方法,即基于最大輸出功率的可控波束形成算法、基于到達時間差的定位算法和基于高分辨率譜估計的定位算法。此外,還介紹了傳聲器陣列模型以及可用于聲源定位研究的房間回響模型。
第11章介紹了語音隱藏的基本原理。首先介紹了信息隱藏基礎理論,然后主要介紹了兩種語音隱藏算法:低比特位編碼法和回聲隱藏算法,最后介紹了算法的常用評價指標以及未來的研究方向。
第12章介紹了語音編碼的基本原理。首先介紹了語音編碼的理論基礎,然后介紹語音編碼的主要性能指標,接著依次介紹了3種語音編碼算法的基本原理和典型代表,最后對未來研究進行了展望。
在附錄中,給出了書中涉及的C++類庫及引入的函數庫和基于Visual Studio的語音采集程序框架及實現。
需要說明的是,書中加“[C]”的章節包含關鍵算法的C++函數及說明。
本書主要由梁瑞宇、趙力、王青云和唐閨臣編著,并由梁瑞宇最后統稿參加本書編寫和校對整理工作的還有包永強、謝躍和趙立丞。本書的出版得到了江蘇高校品牌專業建設工程項目(項目編號:PPZY2015A035)和江蘇省2016年度教育科學規劃重點資助課題(項目編號:B-a/2016/01/44)的資助。作者參考和引用了一些學者的研究成果,具體見參考文獻。在此,作者向這些文獻的著作者表示敬意和感謝,同時誠勢感謝給予此書指導和幫助的老師和同學們。
《語音信號處理(C++版)》還可以配套《語音信號處理實驗教程》(ISBN 978-7-111-53071-8)使用,以方便教師根據不同的學生層次和要求來組織實驗教學,加深學生對知識的理解和掌握。
語音信號處理是一門理論性強、實用面廣、內容新、難度大的交叉學科,同時這門學科又處于快速發展之中,盡管作者在編寫過程中始終注重理論緊密聯系實際,力求以盡可能簡明、通俗的語言,深入淺出、通俗易懂地將這門學科介紹給讀者,但因作者水平有限、時間較倉促,缺點錯誤在所難免,敬請廣大讀者批評指正。
編者
目錄
前言
第1章緒論
1.1語音信號的發展歷程
1.2語音信號處理的研究方向
1.3本書結構第2章語音信號處理的基礎知識
2.1語音的產生與感知
2.2語音產生的數學模型
2.3語音的常用參數
2.4語音信號的數字化
2.5語音信號的表征
2.6思考與復習題第3章語音信號分析方法
3.1概述
3.2語音信號預處理
3.3語音信號的時域分析[C]
3.4語音信號的頻域分析
3.5語音信號的倒譜分析
3.6語音信號的線性預測分析
3.7思考與復習題第4章語音信號特征提取技術
4.1概述
4.2端點檢測[C]
4.3基音周期估計[C]
4.4共振峰估計[C]
4.5思考與復習題第5章語音增強
5.1概述
5.2基礎知識
5.3譜減法
5.4維納濾波法
5.5自適應濾波器法
5.6基于聽覺掩蔽效應的語音增強方法
5.7思考與復習題第6章說話人識別
6.1概述
6.2說話人識別原理及系統結構
6.3應用VQ的說話人識別系統
6.4應用GMM的說話人識別系統
6.5尚需進一步探索的研究課題
6.6思考與復習題第7章語音識別
7.1概述
7.2語音識別原理與系統構成
7.3基于動態時間規整的語音識別系統
7.4基于隱馬爾可夫模型的語音識別系統
7.5性能評測
7.6系統總結
7.7思考與復習題第8章語音信號情感處理
8.1概述
8.2情感理論與情感誘發實驗
8.3情感的聲學特征分析
8.4實用語音情感的識別算法研究
8.5應用與展望
8.6思考與復習題第9章語音合成與轉換
9.1概述
9.2幀合成技術
9.3經典語音合成算法
9.4語音信號的變速和變調[C]
9.5文語轉換系統
9.6語音轉換及其研究方向
9.7思考與復習題第10章聲源定位
10.1概述
10.2雙耳聽覺定位原理及方法
10.3傳聲器陣列模型
10.4房間回響模型[C]
10.5基于傳聲器陣列的聲源定位方法
10.6總結與展望
10.7思考與復習題第11章語音隱藏
11.1概述
11.2信息隱藏基礎
11.3語音信息隱藏算法
11.4常用評價指標
11.5總結與展望
11.6思考與復習題第12章語音編碼
12.1概述
12.2理論依據
12.3主要性能指標
12.4波形編碼
12.5參數編碼
12.6語音信號的混合編碼
12.7研究展望
12.8思考與復習題附錄附錄AMFC類模板及引入的函數庫說明
A.1std::vector簡介
A.2std::complex簡介
A.3FFTW函數庫簡介附錄B基于MFC的語音錄放原理與程序實現
B.1MFC消息機制
B.2基于MFC的語音錄放原理
B.3基于MFC的語音錄放程序實現附錄C書中涉及的C++函數說明參考文獻