摘要 | 第4-5页 |
Abstract | 第5-6页 |
第1章 前言 | 第9-16页 |
1.1 情感语音合成概述 | 第9-10页 |
1.2 情感语音合成的方法 | 第10-14页 |
1.2.1 基于波形拼接的情感语音合成 | 第10-11页 |
1.2.2 基于韵律特征的情感语音合成 | 第11-12页 |
1.2.3 基于统计参数的情感语音合成 | 第12-14页 |
1.3 论文研究内容和结构安排 | 第14-15页 |
1.3.1 论文研究内容 | 第14页 |
1.3.2 论文结构安排 | 第14-15页 |
1.4 本章小结 | 第15-16页 |
第2章 情感语料库的设计与建立 | 第16-23页 |
2.1 情感分类 | 第16-20页 |
2.1.1 离散情感 | 第16-17页 |
2.1.2 连续情感 | 第17-20页 |
2.2 情感获取方式 | 第20页 |
2.3 情感语料库设计 | 第20-21页 |
2.4 情感录音 | 第21-22页 |
2.5 本章小结 | 第22-23页 |
第3章 基于深度神经网络的情感语音合成 | 第23-42页 |
3.1 深度学习结构 | 第23-24页 |
3.2 基于DNN训练的情感语音合成 | 第24-28页 |
3.2.1 深度神经网络 | 第24-25页 |
3.2.2 反向传播 | 第25-26页 |
3.2.3 输入输出特征 | 第26-27页 |
3.2.4 基于DNN的情感语音合成框架 | 第27-28页 |
3.3 基于DNN的说话人自适应情感语音合成 | 第28-33页 |
3.3.1 多任务学习与说话人自适应TTS | 第28-29页 |
3.3.2 基于DNN的说话人自适应情感语音合成模型 | 第29-31页 |
3.3.3 系统框图 | 第31-33页 |
3.4 实验与评测 | 第33-41页 |
3.4.1 对比实验基于HMM的说话人自适应训练情感语音合成 | 第34-35页 |
3.4.2 实验评测方法 | 第35-37页 |
3.4.3 基于DNN离散情感语音实验与评测 | 第37-41页 |
3.5 本章小结 | 第41-42页 |
第4章 PAD模型深度神经网络情感语音合成 | 第42-55页 |
4.1 情感语音PAD评定 | 第43-44页 |
4.2 PAD情绪模型与情感特征参数的联系 | 第44-47页 |
4.2.1 情感状态空间PAD与典型情感之间的映射关系 | 第44-45页 |
4.2.2 PAD与情感特征参数的联系 | 第45-47页 |
4.3 PAD情感判断与情感参数修正 | 第47-49页 |
4.4 基于PAD三维情绪模型的深度学习情感语音合成 | 第49-50页 |
4.5 PAD三维情感模型DNN情感语音合成实验与评测 | 第50-54页 |
4.5.1 合成语句的情感状态 | 第50-51页 |
4.5.2 客观性能评测 | 第51-52页 |
4.5.3 主观评测 | 第52-54页 |
4.6 本章小结 | 第54-55页 |
第5章 总结及展望 | 第55-57页 |
5.1 论文总结 | 第55-56页 |
5.2 下一步工作展望 | 第56-57页 |
参考文献 | 第57-61页 |
附录 A | 第61-63页 |
攻读学位期间的研究成果 | 第63-64页 |
致谢 | 第64页 |