基于卷积神经网络的语音合成声码器研究

摘要	第5-7页
ABSTRACT	第7-8页
第1章绪论	第14-26页
1.1 语音合成技术概述	第14-15页
1.2 语音信号生成机理	第15-16页
1.3 现阶段主流语音合成方法	第16-20页
1.3.1 单元挑选与波形拼接语音合成	第17-18页
1.3.2 统计参数语音合成	第18-20页
1.4 语音合成声码器	第20-23页
1.4.1 线性预测分析合成器	第20-21页
1.4.2 共振峰合成器	第21-22页
1.4.3 STRAIGHT分析合成算法	第22-23页
1.5 本论文的研究目标和内容概述	第23-26页
第2章基于卷积神经网络的话者相关语音合成声码器	第26-38页
2.1 WaveNet简介	第26-30页
2.1.1 卷积神经网络简介	第26-28页
2.1.2 扩张因果卷积	第28-29页
2.1.3 门控激活函数及残差网络结构	第29-30页
2.1.4 波形量化与softmax输出	第30页
2.2 基于卷积神经网络的语音合成声码器	第30-32页
2.2.1 网络结构及时域分辨率调整	第30-31页
2.2.2 采样方式	第31-32页
2.3 实验	第32-36页
2.3.1 实验配置	第32-33页
2.3.2 实验结果及分析	第33-36页
2.4 本章小结	第36-38页
第3章基于卷积神经网络的声码器话者无关与自适应训练方法研究	第38-48页
3.1 说话人自适应历史回顾	第38-39页
3.2 话者无关与自适应训练	第39-40页
3.3 实验	第40-46页
3.3.1 实验配置	第40-41页
3.3.2 实验结果及分析	第41-46页
3.4 本章小结	第46-48页
第4章基于卷积神经网络的声码器改进方法研究	第48-56页
4.1 语音频带扩展	第48-49页
4.2 多分辨率层级化生成方法	第49-51页
4.3 网络训练与语音生成的采样方式	第51页
4.4 实验	第51-54页
4.4.1 实验配置	第51-53页
4.4.2 实验结果及分析	第53-54页
4.5 本章小结	第54-56页
第5章总结	第56-58页
5.1 本文主要贡献与创新点	第56页
5.2 后续研究工作	第56-58页
参考文献	第58-63页
致谢	第63-64页
在读期间发表的学术论文与取得的研究成果	第64页