图书介绍
数字语音-语音编码实用教程pdf电子书版本下载
- 李昌立,吴善培编著 著
- 出版社: 北京:人民邮电出版社
- ISBN:7115124221
- 出版时间:2004
- 标注页数:373页
- 文件大小:19MB
- 文件页数:388页
- 主题词:语音数据处理-编码-教材
PDF下载
下载说明
数字语音-语音编码实用教程PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
目录 1
第1章 语音编码概论 1
1.1 语音编码的数字化 1
1.2 语音编码的必要性和推动力 1
1.3 语音编码的声学基础知识 3
1.3.1 响度级和响度 3
1.3.2 听觉掩蔽和临界频带 4
1.3.3 听觉掩蔽在语音编码中的作用 6
1.3.4 发声器官的声电类比线路 7
1.3.5 语言发声的数学模型 10
1.4 语音信号的物理特性 15
1.4.1 语音信号在时域和频域的特性 15
1.4.2 语音信号的统计特性 17
1.4.3 语音传输所需比特率的估计 19
1.5 除去语音冗余度的方法 21
1.6 语音编码器方案的分类 23
1.6.1 波形近似语音编码器 23
1.6.2 参量编码器 24
1.7 语音编码的发展趋势 24
参考文献 25
第2章 语音信号的采样和量化 27
2.1 采样 27
2.2 标量量化 28
2.2.1 量化误差 29
2.2.2 均匀量化器 30
2.2.3 最佳量化器 31
2.2.4 对数量化器 32
2.2.5 自适应量化器 33
2.2.6 差分量化器 35
2.3 矢量量化 37
2.3.1 失真测度 38
2.3.2 码书设计 39
2.3.3 码书种类 40
2.3.4 训练试验和码书的顽健性 45
参考文献 46
第3章 语音信号的分析和建模 48
3.1 短时频谱分析 48
3.1.1 窗的作用 49
3.2 语音信号的线性预测模型 53
3.2.1 语音产生的源滤波器模型 54
3.2.2 线性预测分析(LPA)的求解 55
3.2.3 线性预测分析的实现和物理解释 62
3.3.1 语音信号的周期性 64
3.3 音调预测 64
3.3.2 音调预测器 65
3.4 音调检测 68
3.4.1 时域波形的相似性方法 69
3.4.2 频率域频谱的相似性方法 72
3.4.3 预处理和后处理技术 74
参考文献 79
第4章 使用线谱频率(LSF)量化线性预测编码(LPC)参量 82
4.1 LPC参量的编码 82
4.2 LPC参量的另外一种表示——PARCOR系数 82
4.3 LPC到LSF的变换 87
4.3.1 LSF的计算 88
4.3.2 LSF到LPC的变换 95
4.3.3 LSF的特性 96
4.4.1 SIVP编码方案 98
4.4 转换型——自适应帧间矢量预测(SIVP) 98
4.4.2 矢量预测器 99
4.4.3 预测误差的量化 100
4.4.4 性能的比较 102
4.4.5 实时实现中的问题 105
4.5 SAVQ编码方案 107
4.5.1 SAVQ系统 107
4.5.2 性能比较 107
4.6 无记忆的LSF量化 109
4.6.1 LSF的分裂矢量量化 109
4.6.2 非均匀的标量量化 109
参考文献 111
第5章 按合成分析法(AbS)的语音编码方案 112
5.1 按合成分析法(AbS)的基本原理 112
5.2 通用的AbS编码方案 113
5.2.1 时变滤波器 114
5.2.2 建立在理解上的最小化程序 115
5.2.3 激励信号 116
5.2.4 最佳激励序列的确定 118
5.2.5 AbS-LPC方案的特性 121
5.3 多脉冲激励线性预测编码(MPLPC) 124
5.3.1 MPLPC的最优幅度激励 125
5.3.2 具有长期预测的MPLPC 127
5.3.3 脉冲位置编码 129
5.3.4 脉冲幅度编码 130
5.3.5 联合的脉冲幅度量化(JPAQ) 132
5.4 码激励线性预测编码 134
5.4.1 引言 134
5.4.2 短期预测(STP) 135
5.4.3 长期预测(LTP) 136
5.4.4 辅助激励的计算 145
5.4.5 LTP和辅助激励联合计算 159
5.4.6 具有后滤波的CELP 160
参考文献 162
第6章 低时延语音编码 165
6.1 编码时延与对低时延编码器的要求 165
6.2 G.728 16kbit/s LD-CELP语音编码器 166
6.2.1 方框图与工作原理 166
6.2.2 高阶后向自适应线性预测 168
6.2.3 听觉加权滤波器 169
6.2.4 激励增益预测器 170
6.2.5 码书结构与搜寻 171
6.2.6 同步和带内信令 178
6.2.7 自适应后置滤波器(adaptive post-filter) 178
6.2.8 G.728编解码器的复杂度和性能 182
参考文献 183
第7章 多带激励声码器 184
7.1 导言 184
7.2 多带激励语音模型 185
7.3 多带激励语音分析 189
7.3.1 频域分析 190
7.3.2 时域分析 192
7.3.3 INMARSAT-M IMBE模型分析算法 195
7.4 多带激励语音合成 204
7.4.1 清音成分的合成 204
7.4.2 浊音成分的合成 205
7.4.3 重建语音的产生 207
参考文献 207
8.1 波形内插语音编码 208
第8章 低速率语音编码 208
8.1.1 浊音语音的波形内插 209
8.1.2 广义WI模型 212
8.1.3 2.4kbit/s GWI语音编码系统 215
8.2 正弦变换编码 218
8.2.1 语音信号的正弦分析 218
8.2.2 语音信号的正弦合成 219
8.2.3 低比特率正弦编码器 220
8.2.4 与原型波形内插相结合 221
8.2.5 基音的频域估计法 222
8.2.6 确定残差信号的正弦模型参数 223
8.2.7 正弦激励参数的量化 227
8.2.8 正弦变换解码器 231
8.2.9 正弦变换编码器的性能 232
参考文献 234
第9章 宽带语音编码 235
9.1 引言 235
9.2 子带编码(sub-band coding) 236
9.2.1 工作原理 236
9.2.2 子带编码的比特分配 237
9.3 G.722宽带语音编码 240
9.3.1 技术要求 240
9.3.2 方框图 240
9.3.3 SB-ADPCM编码器的工作原理 241
9.3.4 SB-ADPCM解码器的工作原理 242
9.3.5 正交镜像滤波器组(quadrature-mirror filter bank) 244
9.3.6 G.722自适应量化与预测 251
参考文献 256
10.1 语音编码标准的发展概况 257
第10章 语音编码的方案和标准算法 257
10.2 语音编码器的属性 258
10.2.1 比特率 258
10.2.2 延迟 258
10.2.3 复杂度 259
10.2.4 语音质量 259
10.2.5 规范和适应性的确认 260
10.3 世界上有哪些标准化实体,他们是怎样开展工作的 261
10.3.1 国际电信联盟(ITU) 261
10.3.2 北美的标准化组织 262
10.3.3 欧洲电信标准研究所 262
10.3.4 日本的RCR 262
10.3.5 我国的电信标准化组织 262
10.3.7 语音编码器的性能测量 263
10.3.6 建立参考条款 263
10.3.8 工作日程 264
10.4 现在的语音编码标准 264
10.4.1 ITU公布的具有电话带宽的语音编码器 265
10.4.2 ITU-T近期发布的电话带宽语音编码器 266
10.4.3 ITU 7kHz宽带语音编码器 267
10.4.4 欧洲的数字蜂窝电话语音编码器 268
10.4.5 北美的数字蜂窝语音编码器 269
10.4.6 日本的数字蜂窝电话编码器 270
10.4.7 国际海事卫星4.15kbit/sIMBE编码器 271
10.4.8 用于保密通信的语音编码标准 272
10.5 语音编码器性能的总结 273
10.6 附加的信息 274
参考文献 274
11.1.2 对信号功率级的依赖 277
11.1.1 对发音者和语言的依赖 277
11.1 语音质量的定义 277
第11章 语音编码器的质量评价 277
11.1.3 背景噪声 278
11.1.4 多种编码的级联 278
11.1.5 信道误差所产生的影响 279
11.1.6 非语音信号 279
11.2 语音质量的客观测量 279
11.3 语音质量的主观测量 280
11.3.1 绝对等级的评定试验(ACR) 281
11.3.2 降低等级的评定试验(DCR) 281
11.3.3 诊断测量试验(DAM) 282
11.3.4 通话试验 282
11.3.5 主观质量的预测 282
11.4.2 对谈话者的辨认能力 283
11.4.1 可懂度 283
11.4 测量语音可懂度和对发音人的识别能力 283
11.5 汉语清晰度测量和语音质量的诊断 284
11.6 检测语音质量的数据库和另外的试验信号 287
11.7 典型MOS试验的描述 288
11.7.1 试验方法和实验的设计 288
11.7.2 语音材料的选择和处理 288
11.7.3 试验结果 290
11.8 确认语音编码器实现的方法 291
11.9 复杂度和延迟的测量 292
11.9.1 复杂度 292
11.9.2 延迟 293
11.10 结论 293
参考文献 293
12.2 数字信号处理器(DSP) 298
12.1 引言 298
第12章 语音编码的实时实现 298
12.2.1 DSP芯片的发展概况 299
12.2.2 定点实现的DSP 300
12.2.3 浮点实现的DSP 304
12.2.4 TI公司的TMS320 C6000芯片系列 305
12.3 实时的软件开发方法 308
12.4 典型的CELP实现方案 309
12.4.1 AT T的WE-DSP32 309
12.4.2 典型的WE-DSP32C基础硬件 310
12.5 DSP的开发和调试工具 312
12.6 有效的编程技术 313
12.6.1 CELP复杂性降低的策略 314
12.6.2 典型CELP方案中对处理和存储的要求 317
参考文献 318
第13章 系统应用中的有关问题 319
13.1 引言 319
13.2 回波抵消 320
13.2.1 数字回波抵消器的原理 321
13.2.2 回波抵消的数学表述 322
13.3 语音不连续的传输(DTX) 324
13.3.1 声音激活的检测 325
13.3.2 语音加数据的编码和传输 328
13.4 传输过程中的同步 329
13.5 语音数据的安全 331
参考文献 333
课程习题与设计选题汇集 334
附录 G.729 8kbit/s共轭结构一代数码激励线性预测编码 337
本书缩写字的中英文译名 370