《電子信息科學與工程類專業電子信息與電氣學科規劃教材:數字語音處理及MATLAB仿真》系統地闡述了語音信號處理的原理、 方法、技術和應用,同時給出了部分內容對應的MATLAB仿真源程序。全書 共12章,第1章至第7章是基本理論部分,包括語音信號的數字模型、語音 信號的短時時域分析和頻域分析、語音信號的同態處理、語音信號線性預 測分析和矢量量化;第8章至第12章是應用部分,包括語音編碼、語音合成 、語音識別、語音增強和語音處理的實時實現。本書內容全面,重點突出 ,原理闡述深入淺出,注重理論與實際應用的結合,可讀性強。 本書可作為高等院校通信工程、電子信息工程、自動控制、計算機技 術與應用等專業高年級本科生相關課程的教材,也可供從事語音信號處理 研究的研究生和科研人員參考。
《電子信息科學與工程類專業電子信息與電氣學科規劃教材:數字語音處理及MATLAB仿真》主要以高年級本科生和初次學習語音信號處理知識的研究生為讀者對象,注重語音信號處理基礎知識及主要應用的描述,同時對本領域的最新成果也有簡單介紹。全書共12章,第1章是緒論;第2章是語音信號的數字模型;第3章是語音信號的短時時域分析;第4章是語音信號短時頻域分析;第5章是語音信號的同態處理;第6章是語音信號線性預測分析;第7章是矢量量化;第8章是語音編碼;第9章是語音合成;第10章是語音識別;第11章是語音增強;第12章是語音處理的實時實現。附錄部分是本書中出現過的專業名詞縮寫及中英文對照,供大家學習時參考。本書第1章至第7章屬于基本理論部分,所附的MATLAB程序較多,第8章至第12章是語音信號處理技術的應用,這方面的程序一般都比較長,且有一定難度,所以附帶的程序較少,且都是相對簡單的。可以說,本書是一本關于語音信號處理的入門實踐教材,在學習和掌握本書內容的基礎上,再進行本專業更深層次的學習是合適的。
第1章 緒論
1.1 概述
1.2 語音信號處理的發展
1.2.1 語音合成
1.2.2 語音編碼
1.2.3 語音識別
1.3 語音信號處理的應用及新方向
1.4 語音信號處理過程的總體結構
1.5 MATLAB在數字語音信號處理中的應用
第2章 語音信號的數字模型
2.1 概述
2.2 語音的發聲機理
2.2.1 人的發聲器官
2.2.2 語音生成
2.3 語音的聽覺機理
2.3.1 聽覺器官
2.3.2 耳蝸的信號處理機制
2.3.3 語音信號聽覺模型
2.4 語音的感知
2.4.1 幾個概念
2.4.2 掩蔽效應
2.4.3 臨界帶寬與頻率群
2.5 語音信號模型
2.5.1 激勵模型
2.5.2 聲道模型
2.5.3 輻射模型
2.6 語音信號數字模型
2.6.1 數字模型
2.6.2 模型局限性
第3章 語音信號的短時時域分析
3.1 概述
3.2 語音信號的預處理
3.2.1 語音信號的預加重處理
3.2.2 語音信號的加窗處理
3.3 短時平均能量
3.4 短時平均幅度函數
3.5 短時平均過零率
3.6 短時自相關分析
3.6.1 短時自相關函數
3.6.2 語音信號的短時自相關函數
3.6.3 修正的短時自相關函數
3.6.4 短時平均幅度差函數
3.7 基于能量和過零率的語音端點檢測
3.8 基音周期估值
3.8.1 基于短時自相關法的基音周期估值
3.8.2 基于短時平均幅度差函數AMDF法的基音周期估值
3.8.3 基音周期估值的后處理
3.8.4 基音周期估值后處理的MATLAB實現
第4章 語音信號短時頻域分析
4.1 概述
4.2 傅里葉變換的解釋
4.3 濾波器的解釋
4.4 短時譜的時域及頻域采樣率
4.5 短時綜合的濾波器組相加法
4.5.1 短時綜合的濾波器組相加法原理
4.5.2 短時綜合的濾波器組相加法的MATLAB程序實現
4.5.3 短時綜合的疊接相加法原理及MATLAB程序實現
第5章 語音信號的同態處理
5.1 概述
5.2 疊加原理和廣義疊加原理
5.3 卷積同態系統
5.4 復倒譜和倒譜
5.4.1 定義
5.4.2 復倒譜的性質
5.5 復倒譜的幾種計算方法
5.5.1 最小相位信號法
5.5.2 遞歸法
5.5.3 倒譜的MATLAB實現
5.6 語音的倒譜分析及應用
5.6.1 語音的倒譜分析原理
5.6.2 語音的倒譜應用
第6章 語音信號線性預測分析
6.1 概述
6.2 LPC的基本原理
6.3 LPC和語音信號模型的關系
6.4 LPC方程的自相關解法及其MATLAB實現
6.5 模型增益G的確定
6.6 線譜對LSP分析
6.6.1 LSP的定義和特點
6.6.2 LPC參數到LSP參數的轉換及MATLAB實現
6.6.3 LSP參數到LPC參數的轉換及MATLAB實現
6.7 導抗譜對ISP分析
6.7.1 ISP的定義和特點
6.7.2 LPC與ISP參數間的轉換及MATLAB實現
6.8 LPC導出的其他語音參數
6.8.1 反射系數
6.8.2 對數面積比系數LAR
6.8.3 LPC倒譜及其MATLAB實現
6.9 LPC分析的頻域解釋
6.9.1 最小預測誤差的頻域解釋
6.9.2 LPC譜估計
第7章 矢量量化
7.1 概述
7.2 矢量量化基本原理
7.2.1 矢量量化的定義
7.2.2 失真測度
7.2.3 矢量量化器
7.3 最佳矢量量化器
7.4 矢量量化器的設計算法及MATLAB實現
7.4.1 LBG算法
7.4.2 初始碼書的選定與空胞腔的處理
7.4.3 已知訓練序列的LBG算法的MATLAB實現
7.5 降低復雜度的矢量量化系統
7.5.1 樹形搜索矢量量化器
7.5.2 多級矢量量化器
7.5.3 波形/增益矢量量化器
7.5.4 分離均值矢量量化器
7.5.5 有記憶的矢量量化
第8章 語音編碼
8.1 概述
8.2 語音編碼的分類及特性
8.2.1 波形編碼
8.2.2 參數編碼
8.2.3 混合編碼
8.2.4 語音壓縮編碼的依據
8.3 語音編碼性能的評價指標
8.3.1 編碼速率
8.3.2 編碼質量
8.3.3 編解碼延時
8.3.4 算法復雜度
8.4 語音信號波形編碼
8.4.1 脈沖編碼調制PCM
8.4.2 自適應預測編碼APC
8.4.3 自適應差分脈沖編碼調制
8.5 語音信號參數編碼
8.5.1 LPC聲碼器原理
8.5.2 LPC?10編碼器
8.6 語音信號混合編碼
8.6.1 合成分析技術和感覺加權濾波器
8.6.2 激勵模型的改進
8.6.3 G.728語音編碼標準簡介
8.7 語音信號寬帶變速率編碼
第9章 語音合成
9.1 概述
9.2 語音合成的原理及分類
9.2.1 波形合成法
9.2.2 參數合成法
9.2.3 規則合成法
9.3 共振峰合成法
9.3.1 級聯型共振峰模型
9.3.2 并聯型共振峰模型
9.3.3 混合型共振峰模型
9.4 線性預測參數合成法
9.5 基音同步疊加法
9.5.1 基音同步疊加PSOLA算法原理
9.5.2 基音同步疊加PSOLA算法實現步驟
9.6 文語轉換系統
9.6.1 文語轉換系統的組成
9.6.2 漢語按規則合成
第10章 語音識別
10.1 概述
10.1.1 預處理
10.1.2 語音識別特征提取
10.1.3 語音識別方法
10.2 HMM基本原理及在語音識別中的應用
10.2.1 隱馬爾可夫模型
10.2.2 隱馬爾可夫模型的三個基本問題
10.2.3 隱馬爾可夫模型用于語音識別
第11章 語音增強
11.1 概述
11.2 語音感知特性和噪聲特性
11.2.1 語音特性
11.2.2 人耳感知特性
11.2.3 噪聲特性
11.3 語音增強算法
11.3.1 參數方法
11.3.2 非參數方法
11.3.3 統計方法
11.3.4 其他方法
11.3.5 譜減法語音增強的仿真實現
第12章 語音處理的實時實現
12.1 概述
12.2 可編程DSP芯片應用基礎
12.2.1 DSP的發展歷程
12.2.2 DSP芯片的特點
12.2.3 DSP芯片的分類
12.2.4 DSP芯片的基本結構
12.2.5 常用DSP芯片簡介
12.2.6 DSP芯片的應用
12.3 基于DSP的語音處理系統
12.3.1 基于DSP的實時語音處理系統的構成
12.3.2 基于DSP的語音處理系統的特點
12.3.3 基于DSP的語音處理系統的設計過程
12.4 DSP CCS集成開發環境
12.4.1 DSP的開發工具
12.4.2 CCS概述
12.4.3 CCS的構成
12.5 基于TMS320C5409的實時語音識別系統
12.5.1 硬件介紹
12.5.2 軟件設計
12.5.3 獨立系統形成
附錄A 專業術語縮寫英漢對照表
參考文獻