汉语语音合成中自动切分技术的研究
摘要 | 第1-6页 |
ABSTRACT | 第6-10页 |
第一章 语音合成概述 | 第10-16页 |
·研究意义 | 第10页 |
·语音合成基本原理 | 第10-14页 |
·基于参数的合成技术 | 第11-12页 |
·基于波形拼接的合成技术 | 第12-14页 |
·语音合成应用现状 | 第14-16页 |
第二章 自动切分系统概述及基线系统的建立 | 第16-21页 |
·自动切分系统概述 | 第16-17页 |
·什么是自动切分 | 第16页 |
·汉语文语转换系统中研究自动切分系统的必要性 | 第16-17页 |
·自动切分系统的研究现状 | 第17-19页 |
·研究语言的分布 | 第17-18页 |
·研究时间的分布 | 第18-19页 |
·研究机构的分布 | 第19页 |
·自动切分基本原理 | 第19-20页 |
·自动切分的评价方式 | 第20-21页 |
第三章 基于HMM的强制对齐 | 第21-29页 |
·HMM模型的训练 | 第21-26页 |
·HMM的模型定义 | 第21-23页 |
·HMM模型训练算法 | 第23-26页 |
·HMM训练策略 | 第26页 |
·模型参数自适应 | 第26-28页 |
·强制对齐 | 第28-29页 |
第四章 汉语文语转化系统中自动切分基线系统的构建 | 第29-42页 |
·语音库的正则化 | 第29-30页 |
·语音库描述 | 第29页 |
·语音库的正则化过程 | 第29-30页 |
·感知线性预测系数(PLP)参数求解过程 | 第30-35页 |
·模型训练和自适应 | 第35-37页 |
·说话人无关的模型训练 | 第35-36页 |
·模型的自适应 | 第36页 |
·加入人工标注的训练数据进行自适应 | 第36页 |
·停顿模型的训练 | 第36页 |
·模型训练和自适应后性能的提高 | 第36-37页 |
·用能量确定语句起始的静音 | 第37-38页 |
·调整帧移输出的位置 | 第38-39页 |
·语音参数配置 | 第39-41页 |
·IF和IFB的定义 | 第39页 |
·PLP参数配置 | 第39-41页 |
·帧移参数配置 | 第41页 |
·MLLR和MAP | 第41页 |
·参数配置 | 第41页 |
·基线系统的性能 | 第41-42页 |
第五章 利用混合模型训练映射规则 | 第42-48页 |
·边界分组 | 第42-43页 |
·语音合成库在每组中的分布 | 第43-44页 |
·利用混合模型方法训练映射规则 | 第44-46页 |
·利用混合模型进行自动切分的实验 | 第46-48页 |
第六章 利用决策树训练映射规则 | 第48-60页 |
·决策树C4.5算法介绍 | 第48-51页 |
·决策树算法 | 第48-49页 |
·C4.5决策树算法 | 第49-51页 |
·利用决策树分类进行自动切分的流程 | 第51-52页 |
·自动切分中决策树的构建 | 第52-55页 |
·问题集的选取 | 第52-53页 |
·映射规则训练流程 | 第53-55页 |
·利用遗传算法进行属性挑选 | 第55-57页 |
·算法中所用到各种进化和遗传学的概念 | 第55页 |
·遗传算法的原理 | 第55-56页 |
·遗传算法的步骤和意义 | 第56-57页 |
·用遗传算法进行属性挑选 | 第57页 |
·利用决策树分类进行自动切分的实验 | 第57-58页 |
·性能比较 | 第58-60页 |
第七章 总结与展望 | 第60-61页 |
参考文献 | 第61-63页 |
附录 | 第63-66页 |
致谢 | 第66-67页 |
作者攻读学位期间发表的学术论文目录 | 第67页 |