摘要 | 第5-7页 |
ABSTRACT | 第7-9页 |
主要缩写对照表 | 第17-19页 |
第一章 绪论 | 第19-33页 |
1.1 研究背景和意义 | 第19-21页 |
1.2 语音编码技术概述 | 第21-25页 |
1.2.1 语音信号的数字模型 | 第21页 |
1.2.2 语音编码类型 | 第21-22页 |
1.2.3 语音压缩编码的理论依据与理论极限 | 第22-23页 |
1.2.4 性能评价指标 | 第23-25页 |
1.3 低速率语音编码技术现状 | 第25-28页 |
1.3.1 识别-合成技术 | 第25-26页 |
1.3.2 多帧联合编码技术 | 第26-27页 |
1.3.3 压缩感知技术 | 第27页 |
1.3.4 倒谱特征技术 | 第27-28页 |
1.4 语音的人耳听觉感知特性 | 第28-30页 |
1.4.1 人耳的时频分析特性 | 第29页 |
1.4.2 人耳听觉掩蔽效应 | 第29页 |
1.4.3 人耳对相位变化不敏感 | 第29-30页 |
1.5 存在问题、主要工作和章节安排 | 第30-33页 |
1.5.1 存在问题及进一步开发的思路 | 第30-31页 |
1.5.2 主要工作及章节安排 | 第31-33页 |
第二章 低信噪比下的鲁棒语音激活检测算法 | 第33-50页 |
2.1 引言 | 第33-35页 |
2.2 基于统计模型的似然比检验鲁棒语音激活检测 | 第35-37页 |
2.2.1 似然比检验的判决准则 | 第35-36页 |
2.2.2 基于最小均方误差的噪声方差估计 | 第36-37页 |
2.3 基于子带双特征的自适应保留似然比鲁棒语音激活检测算法 | 第37-41页 |
2.3.1 保留似然比综合判决准则 | 第38页 |
2.3.2 基于人耳对不同频率语音感知的差异划分子带 | 第38-39页 |
2.3.3 子带归一化双特征 | 第39-41页 |
2.3.4 自适应估计保留阈值 | 第41页 |
2.4 实验与结果分析 | 第41-49页 |
2.4.1 仿真实验 | 第41-47页 |
2.4.2 现场录音实验 | 第47-48页 |
2.4.3 声码器性能测试 | 第48-49页 |
2.5 本章小结 | 第49-50页 |
第三章 基于自适应正交M码字分裂的码本生成算法 | 第50-61页 |
3.1 引言 | 第50-51页 |
3.2 基于二分法的矢量量化码本生成算法 | 第51-53页 |
3.2.1 二分码本生成算法原理 | 第51-52页 |
3.2.2 计算复杂度分析 | 第52-53页 |
3.3 基于自适应正交M码字分裂的矢量量化码本生成算法 | 第53-57页 |
3.3.1 码本生成具体策略 | 第54页 |
3.3.2 正交M码字分裂 | 第54-56页 |
3.3.3 自适应设置分裂系数 | 第56页 |
3.3.4 基于自适应正交M码字分裂的码本生成算法 | 第56-57页 |
3.4 实验及结果分析 | 第57-60页 |
3.4.1 实验设置 | 第57-58页 |
3.4.2 码本性能测试 | 第58-60页 |
3.4.3 综合性能分析 | 第60页 |
3.5 本章小结 | 第60-61页 |
第四章 基于人耳主观感知的多尺度矢量量化码本设计 | 第61-88页 |
4.1 引言 | 第61-62页 |
4.2 编码器谱参数矢量量化算法 | 第62-65页 |
4.2.1 多级矢量量化 | 第62-63页 |
4.2.2 分裂矢量量化 | 第63-64页 |
4.2.3 预测矢量量化 | 第64-65页 |
4.3 基于人耳感知的线谱频率矢量量化码本设计方案 | 第65-74页 |
4.3.1 LSF预测残差及其码本分析 | 第66-68页 |
4.3.2 区域划分 | 第68-69页 |
4.3.3 感知码本生成方法 | 第69-70页 |
4.3.4 实验与结果分析 | 第70-74页 |
4.4 基于自适应多尺度格形矢量量化的线谱频率量化算法 | 第74-86页 |
4.4.1 格型矢量量化 | 第76-77页 |
4.4.2 塔型矢量量化 | 第77-80页 |
4.4.3 基于全局非均匀局部均匀的自适应多尺度塔格型矢量量化 | 第80-83页 |
4.4.4 实验与结果分析 | 第83-86页 |
4.5 本章小结 | 第86-88页 |
第五章 基于结构与内容感知的语音参数重构技术研究 | 第88-98页 |
5.1 引言 | 第88-89页 |
5.2 压缩感知的基本原理 | 第89-90页 |
5.2.1 信号的稀疏表示 | 第89-90页 |
5.2.2 观测矩阵 | 第90页 |
5.2.3 重构算法 | 第90页 |
5.3 基于压缩感知的线谱频率参数重构性能研究 | 第90-93页 |
5.3.1 线谱频率参数的稀疏性分析 | 第91-92页 |
5.3.2 重构性能分析 | 第92-93页 |
5.4 基于稀疏表示的译码端线谱频率参数优化研究 | 第93-96页 |
5.4.1 参数量化误差分析 | 第93-94页 |
5.4.2 基于稀疏表示的LSF参数优化模型 | 第94-95页 |
5.4.3 译码端LSF参数优化方法流程 | 第95页 |
5.4.4 实验与结果分析 | 第95-96页 |
5.5 本章小结 | 第96-98页 |
第六章 基于感知的 500BPS极低速率语音编码算法 | 第98-107页 |
6.1 引言 | 第98页 |
6.2 基于感知的 500BPS语音编码器算法 | 第98-104页 |
6.2.1 编码器整体方案 | 第98-99页 |
6.2.2 参数分析 | 第99-100页 |
6.2.3 参数量化 | 第100-103页 |
6.2.4 合成语音 | 第103-104页 |
6.3 实验与结果分析 | 第104-105页 |
6.3.1 实验设置 | 第104页 |
6.3.2 客观语音质量 | 第104-105页 |
6.3.3 码本存储量与编译码时延 | 第105页 |
6.4 本章小结 | 第105-107页 |
总结与展望 | 第107-110页 |
参考文献 | 第110-121页 |
攻读博士学位期间取得的研究成果 | 第121-123页 |
致谢 | 第123-124页 |
答辩委员会对论文的评定意见 | 第124页 |