首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文

汉语嵌入式TTS系统中的韵律建模和语音合成方法

摘要第6-8页
ABSTRACT第8-10页
第一章 绪论第11-24页
    1.1.课题背景第11页
    1.2.历史和现状第11-21页
        1.2.1.语音合成器的发展历史第11-12页
        1.2.2.语音合成方法的研究概况第12-16页
        1.2.3.韵律研究的内容和方法以及汉语韵律特征概述第16-20页
        1.2.4.韵律标注体系第20-21页
        1.2.5.语音基元库设计概述第21页
    1.3.研究目标及所做的工作第21-23页
    1.4.论文的内容安排第23-24页
第二章 嵌入式音库的设计第24-33页
    2.1.设计思想第24-25页
    2.2.基于知觉的不等长基元频谱间的距离测量第25-30页
        2.2.1.MFCC参数提取第25-28页
        2.2.2.动态时间归整算法(DTW)第28-30页
    2.3.基于知觉的音节聚类算法第30-33页
第三章 韵律模板的研究第33-51页
    3.1.基于统计的韵律模型第33-41页
        3.1.1.韵律建模的概率描述第34-35页
        3.1.2.参数的提取第35-36页
        3.1.3.重音自动检测算法第36-40页
        3.1.4.语料中重音的确定第40-41页
    3.2.韵律的神经网络模型第41-49页
        3.2.1.汉语的声调模型第41-42页
        3.2.2.神经网络拓扑结构第42-44页
        3.2.3.(?)_i~((2))和σ_i~((2))的确定第44-45页
        3.2.4.神经网络模型输出参数的优化第45-46页
        3.2.5.实验结果第46-49页
    3.3.基于LR的基频预测方法第49-51页
第四章 波形拼接算法研究第51-65页
    4.1.拼接合成需要解决的问题第51-52页
    4.2.PSOLA算法原理第52-54页
    4.3.TD-PSOLA方法第54-60页
        4.3.1.信号分解第55-56页
        4.3.2.基音标注第56页
        4.3.3.语音信号浊音/清音判决第56-57页
        4.3.4.加权函数的确定第57-58页
        4.3.5.合成标注点的计算第58页
        4.3.6.用TD-PSOLA算法得到合成信号第58-59页
        4.3.7.残缺帧的处理第59页
        4.3.8.实验结果第59-60页
    4.4.LP-PSOLA算法第60-62页
    4.5.内插拼接算法第62-65页
第五章 结束语第65-67页
附录1 英语韵律标注标准TOBI第67-75页
    A.1.音调(TONAL)层第67-70页
        A.1.1.短语音调第67-68页
        A.1.2.pitch重音第68-69页
        A.1.3.针对pitch重音和短语重音的下倾态势的标记符号第69-70页
        A.1.4.未说明和不确定的情况第70页
    A.2.停顿指示(BREAK INDEX)层第70-71页
        A.2.1.停顿指示表示为如下值:第70-71页
        A.2.2.不确定和未说明的情况第71页
        A.2.3.不流畅的情况第71页
    A.3.正字(ORTHOGRAPHIC)层第71-72页
    A.4.混杂(MISCELLANEOUS)层第72页
    A.5.基频范围HIFO第72-73页
    A.6.层间冗余第73页
    A.7.非WAVES(TM)格式的约定第73-75页
附录2真实韵律参数和预测值对比(部分)第75-80页
参考文献第80-85页
致谢第85-86页
攻读学位期间发表和已接收的学术论文目录第86-87页
学位论文评阅及答辩情况表第87页

论文共87页,点击 下载论文
上一篇:论生育权
下一篇:刑法中的原因自由行为理论研究