图书介绍

数字音视频处理pdf电子书版本下载

韩冰主编；杨曦，张建龙副主编著
出版社：西安：西安电子科技大学出版社
ISBN：9787560647654
出版时间：2018
标注页数：256页
文件大小：52MB
文件页数：265页
主题词：数字技术－应用－音频设备；数字技术－应用－视频信号

PDF下载

点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快] 温馨提示：（请使用BT下载软件FDM进行下载）软件下载地址页直链下载[便捷但速度慢] [在线试读本书] [在线获取解压码]

点击复制MD5值：e890bbd1d150fde3da69b553923e62b7

下载说明

数字音视频处理PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

点击复制85GB完整离线版磁力链接到迅雷FDM等BT下载工具进行下载详情点击-查看共享计划

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台）。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用！后期资源热门了。安装了迅雷也可以迅雷进行下载！

（文件页数要大于标注页数，上中下等多册电子书除外）

注意：本站所有压缩包均有解压码： 点击下载压缩包解压工具

图书目录

第1章绪论 1

1.1 数字音视频基础 1

1.2 数字音视频技术的发展趋势 2

1.3 数字音视频系统的组成 3

1.4 本章小结 6

第2章听视觉处理的脑机制 7

2.1 听觉的生理基础 7

2.1.1 听觉感知模型的国内外研究现状 8

2.1.2 人类听觉系统简介 10

2.1.3 听觉特性 12

2.1.4 听觉掩蔽 13

2.1.5 听觉加工理论 14

2.2 视觉的生理基础 15

2.2.1 研究现状 15

2.2.2 视觉感知 17

2.2.3 人类视觉系统概述 24

2.2.4 视觉注意机制 25

2.3 本章小结 29

第3章数字音频技术基础 30

3.1 数字信号处理基础 30

3.1.1 线性和时不变 30

3.1.2 冲激响应和卷积 30

3.1.3 傅里叶变换、拉普拉斯变换和Z变换 31

3.1.4 离散时间傅里叶变换（DTFT）与离散傅里叶变换（DFT） 32

3.2 语音信号产生模型 33

3.2.1 语音信号产生机理 33

3.2.2 语音信号产生的数字模型 34

3.3 语音信号的时域模型 35

3.3.1 语音信号的预处理 35

3.3.2 短时平均能量 39

3.3.3 短时平均过零率 41

3.3.4 短时自相关函数 42

3.4 语音信号的频谱分析 45

3.4.1 短时傅里叶变换（STFT）的定义和物理意义 45

3.4.2 短时傅里叶变换的取样率 47

3.4.3 语音信号的重构 49

3.4.4 窗长及形状对STFT的影响 50

3.4.5 语音的语谱图分析 50

3.4.6 语音的倒谱 51

3.5 本章小结 52

第4章音视频获取软件和方法 53

4.1 音频信号采集软件和方法 53

4.1.1 常见的音频采集设备的特点 53

4.1.2 音频采集软件Windows录音机 53

4.1.3 音频处理工具Sony Sound Forge 55

4.2 图像/视频信号采集工具和方法 63

4.2.1 图像信息采集技术 63

4.2.2 视频信息采集技术 65

4.3 音频/视频格式的转换 85

4.3.1 音频格式转换 85

4.3.2 视频格式转换 87

4.4 本章小结 88

第5章音频压缩编码 89

5.1 音频压缩概述 89

5.1.1 音频信号 89

5.1.2 音频压缩的必要性和可能性 89

5.2 音频编码技术 90

5.2.1 波形编码 91

5.2.2 参数编码 93

5.2.3 混合编码 94

5.2.4 感知编码 95

5.3 MPEG音频编码标准 99

5.3.1 MPEG-1音频压缩编码标准 100

5.3.2 MPEG-2音频压缩编码标准 103

5.3.3 MPEG-4音频压缩编码标准 107

5.4 本章小结 112

第6章图像视频压缩编码 113

6.1 图像视频压缩概述 113

6.1.1 图像视频信号的特点 113

6.1.2 图像视频压缩的必要性和可行性 114

6.2 图像压缩编码技术 115

6.2.1 图像压缩编码系统的基本结构 115

6.2.2 统计编码 116

6.2.3 变换编码 123

6.2.4 矢量量化编码 124

6.2.5 预测编码 125

6.3 视频编码技术 127

6.3.1 视频编码系统的一般结构 127

6.3.2 视频编码方案分类 128

6.3.3 采用时间预测和变换编码的视频编码 129

6.4 静止图像压缩标准 133

6.4.1 JPEG静止图像压缩标准 133

6.4.2 JPEG 2000静止图像压缩标准 135

6.5 MPEG视频编码标准 136

6.6 本章小结 140

第7章数字音频处理技术 141

7.1 语音信号合成的基本方法 141

7.1.1 概述 141

7.1.2 共振峰合成法 142

7.1.3 线性预测合成法 144

7.1.4 基音同步叠加法 146

7.1.5 文语转换系统 148

7.2 语音识别的基本技术和方法 149

7.2.1 概述 149

7.2.2 语音识别原理 151

7.2.3 特征表示与提取 154

7.2.4 动态时间规整 154

7.2.5 有限状态矢量量化技术 156

7.2.6 孤立字（词）语音识别系统 158

7.2.7 连续语音识别系统 161

7.3 本章小结 162

第8章数字图像/视频处理技术 163

8.1 图像的低层视觉处理 163

8.1.1 概述 163

8.1.2 空域滤波增强 163

8.1.3 频域增强 169

8.2 图像的中层视觉处理 173

8.2.1 概述 173

8.2.2 图像分割的定义和依据 174

8.2.3 边缘点检测 175

8.2.4 边缘线跟踪 179

8.2.5 门限化分割 184

8.2.6 区域分割法 186

8.3 视频处理中的关键技术研究 188

8.3.1 概述 188

8.3.2 镜头边界检测 189

8.3.3 视频关键帧的提取方法 194

8.3.4 视频目标检测 199

8.4 本章小结 208

第9章基于内容的视频检索技术 209

9.1 引言 209

9.1.1 信息检索 209

9.1.2 多媒体检索 209

9.2 基于内容的音频检索 211

9.2.1 国内外研究现状 212

9.2.2 基于内容的音频检索的总体框架 217

9.2.3 基于内容的音频检索的难点 218

9.2.4 现有的音频检索系统 219

9.3 基于内容的图像检索技术 224

9.3.1 基于内容的图像检索系统的检索过程和关键技术 224

9.3.2 现有的图像检索系统 229

9.3.3 图像检索系统的发展趋势 232

9.4 基于内容的视频检索技术 233

9.4.1 引言 233

9.4.2 基于内容的视频检索及关键技术 235

9.4.3 现有的基于内容的视频检索系统 242

9.4.4 TRECVID（The Text RetrievalConference Video Track）会议 246

9.4.5 存在的问题及发展趋势 246

9.5 本章小结 248

参考文献 249