基于MFCC和GMM语音转换技术研究

摘要	第3-4页
Abstract	第4页
1 绪论	第7-12页
1.1 语音转换的定义	第7页
1.2 语音转换的意义与应用	第7-8页
1.3 国内外研究现状及问题	第8-9页
1.4 论文内容和结构安排	第9-12页
2 语音转换相关理论	第12-26页
2.1 语音发音系统	第12-13页
2.2 语音信号的数学模型	第13-15页
2.3 语音信号的时域分析	第15-16页
2.3.1 短时能量和短时平均幅度	第15-16页
2.3.2 短时平均过零率	第16页
2.4 语音信号的频域分析	第16-17页
2.5 相关声学参数	第17-18页
2.6 语音转换的主要方法	第18-23页
2.6.1 矢量量化法	第18-19页
2.6.2 说话人插值法	第19-20页
2.6.3 线性多变量回归法	第20-21页
2.6.4 神经网络法	第21页
2.6.5 高斯混合模型法	第21-22页
2.6.6 隐马尔科夫模型法	第22-23页
2.7 评价标准	第23-26页
2.7.1 客观评价标准	第24页
2.7.2 主观测试标准	第24-26页
3 特征参数	第26-36页
3.1 常见特征参数	第26-28页
3.1.1 LPC系数	第26-27页
3.1.2 LPCC特征参数	第27-28页
3.1.3 MFCC特征参数	第28页
3.2 人的听觉系统和语音的感知	第28-30页
3.2.1 听觉系统的生理机制	第28-29页
3.2.2 听觉特性	第29-30页
3.3 Mel频率简介	第30-36页
3.3.1 梅尔倒谱系数MFCC及其提取算法	第31页
3.3.2 求取MFCC系数的具体算法和步骤	第31-36页
4 语音转换的实现过程	第36-49页
4.1 提取部分	第36-41页
4.2 训练部分	第41-45页
4.2.1 动态时间规整DTW	第41页
4.2.2 训练算法	第41-45页
4.3 转换部分	第45-49页
4.3.1 最小均方误差(MMSE)准则	第45页
4.3.2 转换算法	第45-47页
4.3.3 语音的后期处理	第47-49页
5 实验与仿真	第49-53页
5.1 实验准备	第49页
5.1.1 实验的语音库	第49页
5.1.2 性能指标	第49页
5.2 实验结果与分析	第49-52页
5.2.1 MFCC系数对转换性能的影响	第49-50页
5.2.2 GMM方法对转换性能的影响	第50-51页
5.2.3 说话人对转换性能的影响	第51-52页
5.3 本章小结	第52-53页
6 总结与展望	第53-55页
6.1 工作总结	第53页
6.2 工作展望	第53-55页
致谢	第55-56页
参考文献	第56-59页