基于匹配跟踪的低位率语音编码研究
| 摘要 | 第1-5页 |
| ABSTRACT | 第5-7页 |
| 目录 | 第7-11页 |
| 图表目录 | 第11-13页 |
| 第一章 绪论 | 第13-25页 |
| ·研究背景 | 第13-15页 |
| ·语音压缩的必要性 | 第13-14页 |
| ·语音压缩的途径 | 第14-15页 |
| ·发展现状 | 第15-19页 |
| ·技术的发展 | 第15-16页 |
| ·质量的评价 | 第16-18页 |
| ·标准的推进 | 第18-19页 |
| ·研究目标和方法 | 第19-21页 |
| ·本文的主要工作 | 第21-23页 |
| ·本文的组织 | 第23-25页 |
| 第二章 匹配跟踪 | 第25-41页 |
| ·信号分解 | 第25-26页 |
| ·基展开 | 第26-30页 |
| ·傅立叶变换 | 第26-27页 |
| ·短时傅立叶变换 | 第27页 |
| ·小波变换 | 第27-28页 |
| ·基展开的不足 | 第28-30页 |
| ·冗余展开 | 第30-31页 |
| ·匹配跟踪 | 第31-36页 |
| ·时频原子的产生 | 第31-32页 |
| ·时频原子分解 | 第32-33页 |
| ·Hilbert空间的匹配跟踪 | 第33-35页 |
| ·共轭子空间的匹配跟踪 | 第35-36页 |
| ·原子字典 | 第36-38页 |
| ·Gabor字典 | 第36-37页 |
| ·正弦字典 | 第37-38页 |
| ·匹配跟踪的一些应用 | 第38-40页 |
| ·本章小结 | 第40-41页 |
| 第三章 基于匹配跟踪的信号增强 | 第41-57页 |
| ·信号增强概述 | 第41-43页 |
| ·信号增强 | 第41-42页 |
| ·语音增强 | 第42-43页 |
| ·加性噪声模型 | 第43页 |
| ·加性噪声消除方法 | 第43-44页 |
| ·匹配跟踪的降噪原理 | 第44-45页 |
| ·匹配跟踪降噪过程的实验分析 | 第45-48页 |
| ·相干比阈值λ_c的确定 | 第48-49页 |
| ·实验结果的对比与分析 | 第49-55页 |
| ·匹配跟踪信号增强与小波软门限去噪性能的比较 | 第49-53页 |
| ·匹配跟踪信号增强与谱相减法的比较 | 第53-55页 |
| ·关于相干比阈值λ_c和字典大小的分析 | 第55页 |
| ·本章小结 | 第55-57页 |
| 第四章 基于匹配跟踪的正弦建模 | 第57-87页 |
| ·正弦建模 | 第57-59页 |
| ·传统的正弦建模方法 | 第59-62页 |
| ·基于STFT的谱峰值检测技术 | 第59-61页 |
| ·基于MSE的分析合成技术 | 第61-62页 |
| ·匹配跟踪正弦建模过程 | 第62-63页 |
| ·感觉加权正弦建模 | 第63-64页 |
| ·心理声学模型 | 第64-75页 |
| ·掩蔽效应 | 第64-66页 |
| ·绝对听阈 | 第66页 |
| ·临界带宽 | 第66-69页 |
| ·即时掩蔽与发散函数 | 第69-70页 |
| ·掩蔽阈值模型 | 第70页 |
| ·信号掩蔽率和噪声掩蔽率 | 第70-71页 |
| ·掩蔽阈值的计算 | 第71-75页 |
| ·感知梯度正弦建模 | 第75-79页 |
| ·心理声学模型的调整 | 第76页 |
| ·感知梯度正弦建模算法 | 第76-77页 |
| ·算法说明 | 第77-79页 |
| ·实验结果 | 第79-84页 |
| ·主观试听结果 | 第79-80页 |
| ·跟踪过程的谱分析 | 第80-82页 |
| ·信噪比的比较 | 第82-83页 |
| ·感知收敛比较 | 第83-84页 |
| ·结论与讨论 | 第84-85页 |
| ·本章小结 | 第85-87页 |
| 第五章 基于匹配跟踪的低位率语音编码 | 第87-115页 |
| ·编码问题概述 | 第87-88页 |
| ·基于普通匹配跟踪正弦建模的压缩编码 | 第88-95页 |
| ·编码对象 | 第88-89页 |
| ·幅度的量化 | 第89-91页 |
| ·频率的量化 | 第91-92页 |
| ·相位的量化 | 第92页 |
| ·位分配 | 第92-93页 |
| ·参照标准 | 第93-94页 |
| ·实验结果 | 第94-95页 |
| ·感知梯度正弦建模压缩编码 | 第95-99页 |
| ·编码方案 | 第95-96页 |
| ·频率差分量化 | 第96-97页 |
| ·位分配 | 第97-98页 |
| ·实验结果 | 第98-99页 |
| ·基于动态字典的匹配跟踪压缩编码 | 第99-105页 |
| ·动态字典匹配跟踪 | 第99页 |
| ·频率盒模型 | 第99-100页 |
| ·ERB刻度 | 第100-103页 |
| ·编码方案 | 第103-104页 |
| ·位分配 | 第104页 |
| ·实验结果 | 第104-105页 |
| ·分类的动态字典压缩编码 | 第105-110页 |
| ·语音信号的分类 | 第105-106页 |
| ·浊音帧的分析与合成 | 第106-107页 |
| ·清音帧的分析与合成 | 第107-108页 |
| ·暂态帧的分析与合成 | 第108-109页 |
| ·位分配 | 第109页 |
| ·实验结果 | 第109-110页 |
| ·结合感知梯度和分类动态字典的压缩编码 | 第110-112页 |
| ·综合编码方案 | 第110-112页 |
| ·位分配 | 第112页 |
| ·实验结果 | 第112页 |
| ·本章小结 | 第112-115页 |
| 第六章 基于CAMDF的基音估计与语音分类 | 第115-135页 |
| ·基音估计简介 | 第115-116页 |
| ·AMDF函数及其相关改进算法 | 第116-121页 |
| ·AMDF及其基音估计 | 第116-117页 |
| ·修正的AMDF | 第117-118页 |
| ·变长的AMDF | 第118-120页 |
| ·高分辨的AMDF | 第120-121页 |
| ·循环AMDF及其性能 | 第121-124页 |
| ·定义 | 第121页 |
| ·性质 | 第121-123页 |
| ·性能优势 | 第123-124页 |
| ·基于CAMDF的基音估计算法 | 第124-126页 |
| ·基于CAMDF的语音分类 | 第126-128页 |
| ·实验结果 | 第128-133页 |
| ·测试语音信号 | 第128页 |
| ·CAMDF与AMDF、LVAMDF的对比 | 第128-129页 |
| ·CAMDF与HRAMDF、LVAMDF的对比 | 第129-131页 |
| ·CAMDF与倒谱基音估计结果的对比 | 第131-132页 |
| ·语音分类的实验结果 | 第132-133页 |
| ·分析与讨论 | 第133-134页 |
| ·帧长的选择 | 第133页 |
| ·算法的复杂度 | 第133页 |
| ·清浊判别标准 | 第133-134页 |
| ·误判率 | 第134页 |
| ·结论 | 第134页 |
| ·本章小结 | 第134-135页 |
| 第七章 结论与展望 | 第135-139页 |
| ·本文工作总结 | 第135-136页 |
| ·本文的贡献 | 第136-137页 |
| ·下一步的工作 | 第137-139页 |
| 附录A 测试语音数据库 | 第139-141页 |
| 附录B 编码语音质量的评价和比较 | 第141-145页 |
| 附录C CAMDF函数的性质及其证明 | 第145-151页 |
| 参考文献 | 第151-162页 |
| 发表文章目录 | 第162-163页 |
| 致谢 | 第163页 |