汉语嵌入式TTS系统中的韵律建模和语音合成方法

摘要	第6-8页
ABSTRACT	第8-10页
第一章绪论	第11-24页
1.1.课题背景	第11页
1.2.历史和现状	第11-21页
1.2.1.语音合成器的发展历史	第11-12页
1.2.2.语音合成方法的研究概况	第12-16页
1.2.3.韵律研究的内容和方法以及汉语韵律特征概述	第16-20页
1.2.4.韵律标注体系	第20-21页
1.2.5.语音基元库设计概述	第21页
1.3.研究目标及所做的工作	第21-23页
1.4.论文的内容安排	第23-24页
第二章嵌入式音库的设计	第24-33页
2.1.设计思想	第24-25页
2.2.基于知觉的不等长基元频谱间的距离测量	第25-30页
2.2.1.MFCC参数提取	第25-28页
2.2.2.动态时间归整算法(DTW)	第28-30页
2.3.基于知觉的音节聚类算法	第30-33页
第三章韵律模板的研究	第33-51页
3.1.基于统计的韵律模型	第33-41页
3.1.1.韵律建模的概率描述	第34-35页
3.1.2.参数的提取	第35-36页
3.1.3.重音自动检测算法	第36-40页
3.1.4.语料中重音的确定	第40-41页
3.2.韵律的神经网络模型	第41-49页
3.2.1.汉语的声调模型	第41-42页
3.2.2.神经网络拓扑结构	第42-44页
3.2.3.(?)_i~((2))和σ_i~((2))的确定	第44-45页
3.2.4.神经网络模型输出参数的优化	第45-46页
3.2.5.实验结果	第46-49页
3.3.基于LR的基频预测方法	第49-51页
第四章波形拼接算法研究	第51-65页
4.1.拼接合成需要解决的问题	第51-52页
4.2.PSOLA算法原理	第52-54页
4.3.TD-PSOLA方法	第54-60页
4.3.1.信号分解	第55-56页
4.3.2.基音标注	第56页
4.3.3.语音信号浊音／清音判决	第56-57页
4.3.4.加权函数的确定	第57-58页
4.3.5.合成标注点的计算	第58页
4.3.6.用TD-PSOLA算法得到合成信号	第58-59页
4.3.7.残缺帧的处理	第59页
4.3.8.实验结果	第59-60页
4.4.LP-PSOLA算法	第60-62页
4.5.内插拼接算法	第62-65页
第五章结束语	第65-67页
附录1 英语韵律标注标准TOBI	第67-75页
A.1.音调(TONAL)层	第67-70页
A.1.1.短语音调	第67-68页
A.1.2.pitch重音	第68-69页
A.1.3.针对pitch重音和短语重音的下倾态势的标记符号	第69-70页
A.1.4.未说明和不确定的情况	第70页
A.2.停顿指示(BREAK INDEX)层	第70-71页
A.2.1.停顿指示表示为如下值：	第70-71页
A.2.2.不确定和未说明的情况	第71页
A.2.3.不流畅的情况	第71页
A.3.正字(ORTHOGRAPHIC)层	第71-72页
A.4.混杂(MISCELLANEOUS)层	第72页
A.5.基频范围HIFO	第72-73页
A.6.层间冗余	第73页
A.7.非WAVES(TM)格式的约定	第73-75页
附录2真实韵律参数和预测值对比(部分)	第75-80页
参考文献	第80-85页
致谢	第85-86页
攻读学位期间发表和已接收的学术论文目录	第86-87页
学位论文评阅及答辩情况表	第87页