摘要 | 第1-7页 |
Abstract | 第7-16页 |
第1章 绪论 | 第16-36页 |
·前言 | 第16-17页 |
·基于HMM 模型的参数语音合成方法 | 第17-33页 |
·基于HMM 模型参数语音方法基本原理 | 第17-28页 |
·基于HMM 模型的参数语音合成技术的优点 | 第28-31页 |
·基于HMM 模型的参数语音合成技术的不足以及近期发展 | 第31-33页 |
·本文研究的出发点 | 第33-35页 |
·本章小结 | 第35-36页 |
第2章 时长满方差建模方法 | 第36-44页 |
·目标 | 第36页 |
·传统时长建模方法 | 第36-38页 |
·语音时长的满方差建模以及参数生成 | 第38-42页 |
·时长满方差建模 | 第38-40页 |
·满方差时长模型参数生成 | 第40-41页 |
·主观测听实验 | 第41-42页 |
·本章小结 | 第42-44页 |
第3章 HMM 决策树聚类的优化方法 | 第44-56页 |
·决策树聚类优化的目的 | 第44-46页 |
·基于交叉生成误差的决策树优化方法 | 第46-50页 |
·交叉生成误差的定义 | 第46-47页 |
·基于交叉生成误差的决策树规模整体优化 | 第47-48页 |
·叶子节点基于最小交叉生成误差准则的回溯以及分裂 | 第48-50页 |
·基于最小交叉生成误差的决策树优化实验 | 第50-54页 |
·实验数据 | 第50-51页 |
·决策树规模整体优化实验 | 第51-52页 |
·决策树回溯以及分裂实验 | 第52-54页 |
·本章小结 | 第54-56页 |
第4章 基于发音错误检测的语音合成方法研究 | 第56-90页 |
·背景介绍 | 第56-58页 |
·传统的自然语音发音检错方法 | 第58-61页 |
·后验概率检错算法 | 第59-60页 |
·GOP 算法 | 第60-61页 |
·发音错误检测方法 | 第61页 |
·SVM 简介 | 第61-67页 |
·从Maximum Margin Classifier 到SVM | 第62-65页 |
·核函数和高维空间问题 | 第65-67页 |
·合成语音训练音库标注自动检错 | 第67-73页 |
·背景介绍 | 第67-68页 |
·上下文相关的发音检错系统框架 | 第68-69页 |
·基于对数似然比(Log Likelihood Ratio, LLR)的检错 | 第69-70页 |
·上下文相关竞争单元的引入 | 第70页 |
·多音字检错实验 | 第70-73页 |
·小结 | 第73页 |
·基于支持向量机的合成语音发音错误检测方法 | 第73-79页 |
·合成语音错误分类以及标注方法 | 第73-74页 |
·系统框架 | 第74-76页 |
·合成语音发音错误检测实验 | 第76-78页 |
·小结 | 第78-79页 |
·合成语音发音检错方法的改进 | 第79-85页 |
·基于后验概率声学特征的SVM 分类器 | 第79-80页 |
·基于KFD 分析的上下文相关聚类模型优化 | 第80-84页 |
·基于核函数映射的Fisher 区分性分析 | 第80-83页 |
·基于 KFD 调整自然/非自然声学模型规模实验 | 第83-84页 |
·基于交叉验证的SVM 参数优化 | 第84-85页 |
·基于合成语音发音错误检测的语音合成方法 | 第85-88页 |
·系统框架 | 第85-86页 |
·主观倾向性测听实验 | 第86-88页 |
·本章小结 | 第88-90页 |
第5章 Blizzard Challenge 比赛 | 第90-100页 |
·比赛背景 | 第90页 |
·Blizzard Challenge 2009 | 第90-98页 |
·Blizzard Challenge 2008 系统框架 | 第91-92页 |
·EH1 任务 | 第92-93页 |
·EH2 任务 | 第93-94页 |
·ES1 任务 | 第94页 |
·Blizzard Challenge 2009 比赛评测结果 | 第94-98页 |
·本章小结 | 第98-100页 |
第6章 总结 | 第100-104页 |
·本文的主要贡献与创新点 | 第100-101页 |
·后续的研究工作 | 第101-104页 |
参考文献 | 第104-114页 |
博士期间发表的论文和参与的研究工作 | 第114-116页 |
发表论文 | 第114-115页 |
所获奖项 | 第115页 |
研究经历 | 第115-116页 |
致谢 | 第116-117页 |