基于神经网络的语音转换

摘要	第4-5页
Abstract	第5页
第1章绪论	第8-12页
1.1 语音转换的概念	第8页
1.2 语音转换的研究背景及意义	第8-9页
1.3 国内外现状研究	第9-11页
1.4 论文的主要研究内容	第11-12页
第2章语音转换的关键技术	第12-30页
2.1 语音信号的声学基础	第12-14页
2.1.1 语音信号的产生	第12-13页
2.1.2 语音信号的线性产生模型	第13-14页
2.1.3 语音特征的分类	第14页
2.2 语音信号的预处理、分析与合成	第14-16页
2.2.1 语音信号的预处理	第14-15页
2.2.2 基于STRAIGHT的语音分析及合成	第15-16页
2.3 动态时间规整	第16-18页
2.4 音段特征（频谱特征）的转换	第18-23页
2.4.1 基于码本映射的频谱特征转换	第18-19页
2.4.2 基于高斯混合模型的频谱特征转换	第19-20页
2.4.3 基于深度置信网络的频谱特征转换	第20-21页
2.4.4 基于受限玻尔兹曼机的频谱特征转换	第21-22页
2.4.5 基于条件受限玻尔兹曼机的频谱特征转换	第22页
2.4.6 基于非负矩阵分解的语音转换模型	第22-23页
2.5 超音段特征的转换	第23-27页
2.5.1 基频的转换	第24页
2.5.2 音长的转换	第24-27页
2.6 小波变换在语音信号处理中的作用	第27-28页
2.6.1 小波变换及其在语音韵律分析中的作用	第27页
2.6.2 小波变换的多分辨分析	第27-28页
2.7 语音转换系统的评价标准	第28-30页
2.7.1 客观评测	第28-29页
2.7.2 主观评测	第29-30页
第3章基于神经网络的语音转换	第30-41页
3.1 神经网络的概念及其发展历史	第30-32页
3.2 神经网络的基本结构	第32-34页
3.2.1 人工神经元	第32-33页
3.2.2 人工神经网络的拓扑特性	第33-34页
3.3 预训练	第34-36页
3.3.1 基于深度置信网络的预训练	第34-35页
3.3.2 基于分层反向传播的预训练	第35-36页
3.4 人工神经网络的训练	第36-39页
3.4.1 基于帧误差的训练准则	第36-38页
3.4.2 基于序列误差的训练准则	第38-39页
3.5 基于小波分析的基频分解	第39-41页
第4章语音转换系统实验	第41-49页
4.1 实验设置	第41-42页
4.2 混合高斯模型与神经网络的性能比较	第42-43页
4.3 谱特征表示分析	第43页
4.4 预训练	第43-44页
4.5 基于最小化序列误差的训练准则的神经网络训练的收敛性质	第44-45页
4.6 基于最小化帧误差训练准则vs.基于最小化序列误差训练准则	第45-46页
4.7 基于高斯归一化的基频转换vs.基于神经网络的基频转换	第46-47页
4.8 基于小波分解的基频转换	第47-49页
结论	第49-50页
参考文献	第50-56页
攻读硕士学位期间发表的论文及其他成果	第56-58页
致谢	第58页