摘要 | 第1-15页 |
ABSTRACT | 第15-17页 |
第一章 绪论 | 第17-36页 |
·研究意义与研究背景 | 第17-19页 |
·可视语音合成研究方法综述 | 第19-31页 |
·人脸动画合成 | 第19-23页 |
·语音动画合成 | 第23-30页 |
·表情合成 | 第30-31页 |
·应用领域 | 第31-32页 |
·可视语音合成技术发展趋势 | 第32-34页 |
·本文的组织结构及创新点 | 第34-36页 |
第二章 基于峰值聚类检测的彩色噪声图像唇部提取方法研究 | 第36-62页 |
·平行线投影快速分割算法 | 第37-39页 |
·含噪声图像直方图分析 | 第37-38页 |
·平行线投影分割PHist算法 | 第38-39页 |
·基于直方图的加权模糊聚类分割算法 | 第39-41页 |
·聚类趋势检验指导的分割方法 | 第41-43页 |
·彩色人脸图像唇部区域提取方法 | 第43-44页 |
·实验结果及分析 | 第44-61页 |
·传统的一维阈值分割方法与PHist阈值分割方法结果比较 | 第44-47页 |
·传统二维阈值分割方法与PHist阈值分割方法结果比较 | 第47-49页 |
·PHistFCM方法用于彩色唇部区域提取 | 第49页 |
·采用TendencyHist方法的噪声图像分割 | 第49-57页 |
·TendencyHist方法合理性讨论 | 第57-59页 |
·亮度及对比度对噪声分布的影响 | 第59-61页 |
·小结 | 第61-62页 |
第三章 大规模汉语双模态语料库设计 | 第62-87页 |
·双模态语料库特点 | 第62-65页 |
·真实性 | 第63页 |
·代表性 | 第63-64页 |
·规范性 | 第64页 |
·多样性 | 第64-65页 |
·双模态语料库建库原则和流程 | 第65-66页 |
·原始语料选取 | 第66-69页 |
·语料范围 | 第66-67页 |
·语料年代 | 第67-68页 |
·语料库组成及文件命名规则 | 第68-69页 |
·基于口型特征的音素聚类 | 第69-75页 |
·口型特征参数提取 | 第69-70页 |
·C-均值聚类算法 | 第70页 |
·基于特征加权的模糊C-均值聚类算法 | 第70-71页 |
·基于人工免疫的混合聚类算法 | 第71-72页 |
·聚类结果比较 | 第72-75页 |
·基于汉语三视素的语料选取算法 | 第75-83页 |
·汉语连续语音三音素结构 | 第75-76页 |
·汉语三视素结构 | 第76-78页 |
·基于三视素的双模态语料选取算法 | 第78-80页 |
·语料选取结果与分析 | 第80-83页 |
·双模态语料录制条件 | 第83-84页 |
·双模态语料标注及切分 | 第84-85页 |
·小结 | 第85-87页 |
第四章 语音驱动的汉语可视语音合成方法研究 | 第87-120页 |
·隐马尔可夫模型基本原理和参数 | 第87-89页 |
·隐马尔可夫模型基本算法 | 第89-94页 |
·前向-后向算法 | 第89-91页 |
·Viterbi算法 | 第91-92页 |
·Baum-Welch重估算法 | 第92-93页 |
·HMM反向算法 | 第93-94页 |
·基于隐马尔可夫模型的可视语音合成主要方法 | 第94-96页 |
·汉语动态视素 | 第96-100页 |
·语音驱动的基于HMM的可视语音合成 | 第100-108页 |
·语音特征参数提取 | 第100-103页 |
·HMM模型状态合成方法 | 第103-104页 |
·混合参数合成方法 | 第104-107页 |
·双层HMM模型合成方法 | 第107-108页 |
·实验结果 | 第108-119页 |
·HMM模型状态合成方法实验结果 | 第109-113页 |
·混合参数合成方法实验结果 | 第113-116页 |
·双层HMM模型合成方法实验结果 | 第116-119页 |
·小结 | 第119-120页 |
第五章 文本驱动的汉语可视语音合成方法研究 | 第120-142页 |
·文本驱动的基于HMM模型的可视语音合成 | 第120-122页 |
·文本驱动的基于单元拼接的可视语音合成 | 第122-128页 |
·基于单元拼接的可视语音合成流程 | 第122-123页 |
·基于Viterbi算法的拼接单元搜索过程 | 第123-125页 |
·口型单元拼接规则 | 第125-128页 |
·唇部区域缝合及修补过程 | 第128-131页 |
·唇部区域与背景视频缝合过程 | 第128-129页 |
·用于修补的快速行进算法基本思想 | 第129-130页 |
·快速行进算法流程 | 第130-131页 |
·实验结果 | 第131-140页 |
·基于HMM模型的合成方法实验结果 | 第131-134页 |
·基于单元拼接的合成方法实验结果 | 第134-137页 |
·唇部区域与背景缝合及修补实验结果 | 第137-140页 |
·小结 | 第140-142页 |
第六章 可视语音合成性能客观评估方法研究 | 第142-151页 |
·性能评估的意义及评估方法研究现状 | 第142-143页 |
·改进的乘积HMM模型 | 第143-145页 |
·利用GPD算法优化权重 | 第145页 |
·性能评估实验结果 | 第145-150页 |
·权重系数与瞬时SNR的关系 | 第145-147页 |
·权重系数对识别率的影响分析 | 第147-148页 |
·不同方案对识别结果的影响 | 第148-149页 |
·可视语音合成质量评估 | 第149-150页 |
·小结 | 第150-151页 |
第七章 结束语 | 第151-153页 |
致谢 | 第153-155页 |
参考文献 | 第155-165页 |
作者在学期间取得的学术成果 | 第165-167页 |
作者在学期间参加的科研项目 | 第167页 |