首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音合成论文

真实感汉语可视语音合成关键技术研究

摘要第1-15页
ABSTRACT第15-17页
第一章 绪论第17-36页
   ·研究意义与研究背景第17-19页
   ·可视语音合成研究方法综述第19-31页
     ·人脸动画合成第19-23页
     ·语音动画合成第23-30页
     ·表情合成第30-31页
   ·应用领域第31-32页
   ·可视语音合成技术发展趋势第32-34页
   ·本文的组织结构及创新点第34-36页
第二章 基于峰值聚类检测的彩色噪声图像唇部提取方法研究第36-62页
   ·平行线投影快速分割算法第37-39页
     ·含噪声图像直方图分析第37-38页
     ·平行线投影分割PHist算法第38-39页
   ·基于直方图的加权模糊聚类分割算法第39-41页
   ·聚类趋势检验指导的分割方法第41-43页
   ·彩色人脸图像唇部区域提取方法第43-44页
   ·实验结果及分析第44-61页
     ·传统的一维阈值分割方法与PHist阈值分割方法结果比较第44-47页
     ·传统二维阈值分割方法与PHist阈值分割方法结果比较第47-49页
     ·PHistFCM方法用于彩色唇部区域提取第49页
     ·采用TendencyHist方法的噪声图像分割第49-57页
     ·TendencyHist方法合理性讨论第57-59页
     ·亮度及对比度对噪声分布的影响第59-61页
   ·小结第61-62页
第三章 大规模汉语双模态语料库设计第62-87页
   ·双模态语料库特点第62-65页
     ·真实性第63页
     ·代表性第63-64页
     ·规范性第64页
     ·多样性第64-65页
   ·双模态语料库建库原则和流程第65-66页
   ·原始语料选取第66-69页
     ·语料范围第66-67页
     ·语料年代第67-68页
     ·语料库组成及文件命名规则第68-69页
   ·基于口型特征的音素聚类第69-75页
     ·口型特征参数提取第69-70页
     ·C-均值聚类算法第70页
     ·基于特征加权的模糊C-均值聚类算法第70-71页
     ·基于人工免疫的混合聚类算法第71-72页
     ·聚类结果比较第72-75页
   ·基于汉语三视素的语料选取算法第75-83页
     ·汉语连续语音三音素结构第75-76页
     ·汉语三视素结构第76-78页
     ·基于三视素的双模态语料选取算法第78-80页
     ·语料选取结果与分析第80-83页
   ·双模态语料录制条件第83-84页
   ·双模态语料标注及切分第84-85页
   ·小结第85-87页
第四章 语音驱动的汉语可视语音合成方法研究第87-120页
   ·隐马尔可夫模型基本原理和参数第87-89页
   ·隐马尔可夫模型基本算法第89-94页
     ·前向-后向算法第89-91页
     ·Viterbi算法第91-92页
     ·Baum-Welch重估算法第92-93页
     ·HMM反向算法第93-94页
   ·基于隐马尔可夫模型的可视语音合成主要方法第94-96页
   ·汉语动态视素第96-100页
   ·语音驱动的基于HMM的可视语音合成第100-108页
     ·语音特征参数提取第100-103页
     ·HMM模型状态合成方法第103-104页
     ·混合参数合成方法第104-107页
     ·双层HMM模型合成方法第107-108页
   ·实验结果第108-119页
     ·HMM模型状态合成方法实验结果第109-113页
     ·混合参数合成方法实验结果第113-116页
     ·双层HMM模型合成方法实验结果第116-119页
   ·小结第119-120页
第五章 文本驱动的汉语可视语音合成方法研究第120-142页
   ·文本驱动的基于HMM模型的可视语音合成第120-122页
   ·文本驱动的基于单元拼接的可视语音合成第122-128页
     ·基于单元拼接的可视语音合成流程第122-123页
     ·基于Viterbi算法的拼接单元搜索过程第123-125页
     ·口型单元拼接规则第125-128页
   ·唇部区域缝合及修补过程第128-131页
     ·唇部区域与背景视频缝合过程第128-129页
     ·用于修补的快速行进算法基本思想第129-130页
     ·快速行进算法流程第130-131页
   ·实验结果第131-140页
     ·基于HMM模型的合成方法实验结果第131-134页
     ·基于单元拼接的合成方法实验结果第134-137页
     ·唇部区域与背景缝合及修补实验结果第137-140页
   ·小结第140-142页
第六章 可视语音合成性能客观评估方法研究第142-151页
   ·性能评估的意义及评估方法研究现状第142-143页
   ·改进的乘积HMM模型第143-145页
   ·利用GPD算法优化权重第145页
   ·性能评估实验结果第145-150页
     ·权重系数与瞬时SNR的关系第145-147页
     ·权重系数对识别率的影响分析第147-148页
     ·不同方案对识别结果的影响第148-149页
     ·可视语音合成质量评估第149-150页
   ·小结第150-151页
第七章 结束语第151-153页
致谢第153-155页
参考文献第155-165页
作者在学期间取得的学术成果第165-167页
作者在学期间参加的科研项目第167页

论文共167页,点击 下载论文
上一篇:雷达辐射源识别关键技术研究
下一篇:激光成像雷达目标识别算法研究