图书介绍

语音信号处理pdf电子书版本下载

语音信号处理
  • 韩纪庆等编著 著
  • 出版社: 北京:清华大学出版社
  • ISBN:7302088314
  • 出版时间:2004
  • 标注页数:328页
  • 文件大小:20MB
  • 文件页数:339页
  • 主题词:语言信号处理-高等学校-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快] 温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页 直链下载[便捷但速度慢]   [在线试读本书]   [在线获取解压码]

下载说明

语音信号处理PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

目录 1

前言 1

第1章 绪论 1

1.1 语音信号处理的发展 1

1.2 语音信号处理的应用及新方向 7

1.3 语音信号处理过程的总体结构 9

参考文献 10

第2章 语音信号的声学基础及产生模型 11

2.1 语音信号的产生 12

2.1.1 语音的发音器官 12

2.1.2 语音的声学特征 14

2.1.3 语音信号在时域和频域的表示 17

2.1.4 汉语中语音的分类 20

2.1.5 汉语语音的韵律特性 22

2.2 语音信号的感知 23

2.2.1 听觉系统 23

2.2.2 听觉特性 25

2.2.3 掩蔽效应 27

2.3 语音信号的线性产生模型 32

2.3.1 激励模型 32

2.3.2 声道模型 33

2.4 语音信号的非线性产生模型 34

2.3.3 辐射模型 34

2.4.1 调频-调幅模型的基本原理 35

2.4.2 Teager能量算子 36

2.4.3 能量分离算法 37

2.4.4 调频-调幅模型的应用 38

参考文献 41

第3章 语音信号的特征分析 43

3.1 语音信号数字化 44

3.1.1 语音信号的采样与量化 44

3.1.2 短时加窗处理 46

3.2.1 短时能量分析 48

3.2 语音信号的时域分析 48

3.2.2 短时平均过零率 49

3.2.3 短时自相关函数和短时平均幅度差函数 51

3.2.4 端点检测和语音分割 55

3.3 语音信号的频域分析 56

3.3.1 滤波器组方法 56

3.3.2 傅里叶频谱分析 57

3.4 传统傅里叶变换缺点及时频分析的思想 59

3.4.1 信号的时频表示 61

3.4.2 不确定原理 63

3.5 Gabor变换 64

3.6 小波变换在语音信号分析中的应用 67

3.6.1 小波的数学表示及意义 67

3.6.2 小波分析特点 69

3.6.3 小波变换的多分辨分析 70

3.6.4 小波变换在语音处理中的应用 72

3.7 语音信号的同态解卷积 75

3.7.1 同态信号处理的基本原理 75

3.7.2 语音信号的复倒谱 77

3.7.3 避免相位卷绕的算法 79

3.8 语音信号特征应用 84

3.7.4 基于听觉特性的Mel频率倒谱系数 84

3.8.1 基音周期估计 85

3.8.2 共振峰的估计 91

参考文献 94

第4章 语音信号的线性预测分析 96

4.1 线性预测的基本原理 96

4.2 线性预测方程组的解法 99

4.2.1 自相关法 99

4.2.2 协方差法 102

4.2.3 格型法 102

4.2.4 几种求解线性预测方法的比较 107

4.3.2 反射系数 108

4.3 线性预测的几种推演参数 108

4.3.1 归一化自相关函数 108

4.3.3 预测器多项式的根 109

4.3.4 LPC倒谱 109

4.3.5 全极点系统的冲激响应及其自相关函数 110

4.3.6 预测误差滤波器的冲激响应及其自相关函数 111

4.3.7 对数面积比系数 111

4.4 线谱对分析法 111

4.4.1 线谱对分析的原理 111

参考文献 113

4.4.2 线谱对参数的求解 113

第5章 语音编码 114

5.1 波形编码 115

5.1.1 均匀量化PCM 115

5.1.2 非均匀量化PCM 116

5.1.3 自适应量化PCM 117

5.1.4 差分脉冲编码 118

5.1.5 自适应差分脉冲编码 120

5.1.6 增量调制和自适应增量调制 123

5.1.7 子带编码 124

5.1.8 自适应变换域编码 126

5.2.1 参数编码 127

5.2 参数编码和混合编码 127

5.2.2 基于全极点语音产生模型的混合编码 133

5.2.3 基于正弦模型的混合编码 147

5.3 极低速率语音编码技术 151

5.3.1 400 bps~1.2 Kbps的声码器 152

5.3.2 识别合成型声码器 153

5.4 语音编码器的性能指标和质量评测方法 154

5.4.1 编码速率 154

5.4.2 顽健性 155

5.4.3 时延 155

5.4.5 语音质量及其评价方法 156

5.4.4 计算复杂度和算法的可扩展性 156

5.5 语音编码国际标准 158

参考文献 159

第6章 语音合成 160

6.1 语音合成的基本原理 161

6.2 参数合成方法 165

6.2.1 线性预测合成方法 165

6.2.2 共振峰合成方法 167

6.3 波形拼接合成技术 172

6.3.1 TD-PSOLA算法 173

6.3.2 FD-PSOLA算法 177

6.4 汉语按规则合成 179

6.4.1 韵律规则 180

6.4.2 多音节协同发音规则合成 187

6.4.3 轻声音节规则合成 188

6.4.4 儿化音节的规则合成 189

参考文献 189

第7章 语音识别 191

7.1 概述 191

7.2 基于矢量量化的识别技术 193

7.2.1 无时间归正的矢量量化 193

7.2.2 有记忆矢量量化 195

7.3 动态时间归正的识别技术 196

7.3.1 DTW基本原理 196

7.3.2 模板训练算法 198

7.4 隐马尔可夫模型技术 200

7.4.1 HMM基本思想 200

7.4.2 HMM基本算法 203

7.4.3 HMM算法实现中的问题 208

7.4.4 关于HMM训练的几点考虑 213

7.5 连接词语音识别技术 218

7.5.1 连接词识别问题的一般描述 219

7.5.2 二阶动态规划算法 220

7.5.3 分层构筑方法 221

7.6 大词汇量连续语音识别技术 225

7.6.1 声学模型 226

7.6.2 语言学模型 228

7.6.3 最优路径搜索 230

7.7 关键词检出技术 232

7.7.1 问题描述 233

7.7.2 关键词检出系统的组成 234

7.7.3 垃圾模型建模方法 235

7.7.4 语音解码器的设计 237

7.7.6 关键词检出系统性能优化 238

7.7.5 关键词确认过程 238

7.8 基于HMM的自适应技术 239

7.8.1 基于Bayesian理论的自适应方法 239

7.8.2 基于变换的自适应方法 240

7.9 语音识别的应用技术 242

7.9.1 语音信息检索 243

7.9.2 发音学习技术 244

7.9.3 基于语音的情感处理 250

7.9.4 网络环境下的语音识别 254

7.9.5 嵌入式语音识别技术 257

参考文献 258

8.1 概述 262

第8章 说话人识别 262

8.2 说话人识别的特征选取 266

8.2.1 特征参数的评价方法 266

8.2.2 说话人识别系统中常用的特征 268

8.3 说话人识别的主要方法 269

8.3.1 与文本有关的识别方法 269

8.3.2 与文本无关的识别方法 270

8.3.3 文本提示型的识别方法 279

8.3.4 说话人识别技术中的一些实际问题 280

参考文献 284

9.2 影响语音识别性能的环境变化因素 286

9.1 概述 286

第9章 顽健语音识别技术 286

9.3 噪声环境下的顽健语音识别技术 289

9.3.1 基于语音增强的方法 289

9.3.2 通道畸变的抑制方法 294

9.3.3 基于模型的补偿方法 300

9.4 变异语音识别方法 316

9.4.1 变异语音的分析 317

9.4.2 变异语音的分类 317

9.4.3 变异语音的识别 320

参考文献 325

精品推荐