非平行文本下基于变分自编码模型和瓶颈特征的高质量语音转换研究

摘要	第4-6页
Abstract	第6-7页
第一章绪论	第10-16页
1.1 语音转换的概念	第10页
1.2 语音转换技术背景及发展现状	第10-13页
1.3 语音转换技术的意义	第13-14页
1.4 本文主要工作及论文组织结构	第14-16页
第二章语音转换理论基础	第16-32页
2.1 语音发音系统模型	第16-20页
2.1.1 语音信号的产生机制	第16-18页
2.1.2 语音信号产生的数学模型	第18-20页
2.2 语音信号的预处理和分析	第20-22页
2.3 语音信号个性特征参数	第22-23页
2.3.1 语音信号个性特征参数的分类	第22-23页
2.3.2 常用的语音特征参数	第23页
2.4 语音转换系统的基本原理	第23-24页
2.5 语音转换的关键技术	第24-28页
2.5.1 语音信号的频谱转换	第24-27页
2.5.2 基频的转换	第27-28页
2.6 语音转换性能评价	第28-30页
2.6.1 客观评价标准	第28-29页
2.6.2 主观评价标准	第29-30页
2.7 本章小结	第30-32页
第三章基于VAE+Bottlenck特征的语音转换	第32-46页
3.1 AHOcoder语音声码器	第33-34页
3.2 VAE模型的基本原理	第34页
3.3 VAE模型的参数估计	第34-36页
3.4 基于VAE+Bottleneck特征的语音转换	第36-39页
3.4.1 Bottleneck特征介绍	第37页
3.4.2 基于语音转换任务的VAE模型	第37-39页
3.5 仿真实验及结果分析	第39-45页
3.5.1 实验设置	第39-41页
3.5.2 实验结果	第41-45页
3.6 本章小结	第45-46页
第四章基于VAE+Bottleneck的M2M语音转换系统	第46-58页
4.1 多对多(M2M)语音转换问题	第46-47页
4.2 基于VAE+Bottleneck特征的M2M语音转换模型	第47-50页
4.2.1 基于DNN的说话人识别任务的Bottlenec特征	第47-48页
4.2.2 DNN网络Bottleneck层自适应	第48-50页
4.3 仿真实验及结果分析	第50-56页
4.4 本章小结	第56-58页
第五章总结与展望	第58-61页
5.1 工作总结	第58-59页
5.2 工作展望	第59-61页
参考文献	第61-64页
附录1 攻读硕士学位期间撰写的论文	第64-65页
附录2 攻读硕士学位期间申请的专利	第65-66页
附录3 攻读硕士学位期间参加的科研项目	第66-67页
致谢	第67页