首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音合成论文

语音合成音库自动标注方法研究

摘要第1-7页
ABSTRACT第7-10页
目录第10-14页
插图第14-16页
表格第16-17页
第一章 绪论第17-29页
   ·语音合成技术概述第17-18页
   ·语音的产生过程第18-19页
     ·语音产生的生理机理第18页
     ·语音产生的数学模型第18-19页
   ·语音合成历史回顾第19-22页
     ·机械式语音合成器第19页
     ·电子式语音合成器第19-20页
     ·共振峰参数合成器第20页
     ·基于波形拼接技术的语音合成第20-21页
     ·基于统计声学建模的语音合成第21-22页
   ·合成音库的构建第22-25页
     ·语料设计第22页
     ·音库录制第22-23页
     ·音段标注第23-24页
     ·韵律标注第24-25页
   ·本文的研究背景和意义第25-27页
   ·本文的研究目标和内容概述第27-29页
第二章 自动韵律标注方法综述第29-45页
   ·有监督的自动韵律标注方法第29-35页
     ·基于决策树的标注方法第29-31页
     ·基于HMM的标注方法第31-34页
     ·基于GMM的标注方法第34页
     ·基于最大熵分类器的标注方法第34-35页
   ·无监督的自动韵律标注方法第35-40页
     ·基于概率模型分类器的无监督标注方法第35-36页
     ·基于HMM的无监督标注方法第36-38页
     ·基于GMM的无监督标注方法第38-39页
     ·基于韵律模型的无监督标注方法第39-40页
   ·本章小结第40-45页
第三章 基于HMM声学建模与状态解码的自动韵律标注方法第45-69页
   ·基于CD-GMM-HMMs的声学建模方法第45-51页
     ·CD-GMM-HMMs简介第45-47页
     ·基于CD-GMM-HMMs声学建模在语音合成中的应用第47-51页
   ·基于穷举搜索的自动韵律标注方法第51-57页
     ·基本思想第51-52页
     ·算法实现第52-55页
     ·韵律标注实验第55-57页
   ·基于Viterbi搜索的自动韵律标注方法第57-67页
     ·基本思想第57-58页
     ·算法实现第58-62页
     ·韵律标注实验第62-64页
     ·自然度主观测听实验第64-67页
   ·本章小结第67-69页
第四章 自动韵律标注中的DNN-HMM声学建模方法第69-81页
   ·基于深度神经网络声学建模方法第69-74页
     ·深度学习与深度神经网络简介第69-70页
     ·深度神经网络的训练方法第70-73页
     ·DNN-HMM声学模型第73-74页
   ·基于DNN-HMM声学建模的自动韵律标注方法第74-80页
     ·基本思想第74页
     ·算法实现第74-77页
     ·自动韵律标注实验第77-79页
     ·自然度主观测听实验第79-80页
   ·本章小结第80-81页
第五章 结合特征聚类初始化与HMM声学建模的无监督自动韵律标注方法第81-97页
   ·算法概述第82-84页
     ·基本思想第82页
     ·韵律标注第82-83页
     ·模型训练第83-84页
   ·结合特征聚类初始化与HMM声学建模的无监督韵律短语标注第84-85页
     ·韵律短语边界的初始化第84-85页
   ·结合特征聚类初始化与HMM声学建模的无监督重音自动标注第85-87页
     ·重音标注的初始化第86-87页
     ·重音标注上下文信息的设计第87页
     ·重音标注词图的设计第87页
   ·实验第87-94页
     ·无监督韵律短语自动标注实验第88-91页
     ·无监督重音自动标注实验第91-94页
   ·本章小结第94-97页
第六章 基于隐藏重音状态的无监督重音标注与合成方法第97-107页
   ·基本思想第97-98页
   ·算法实现第98-102页
     ·重音标注的初始化第98-101页
     ·重音标注/合成模型的更新第101-102页
   ·实验第102-105页
     ·重音感知实验第103页
     ·主观测听实验第103-105页
   ·本章小结第105-107页
第七章 总结与展望第107-111页
   ·本章的主要贡献与创新点第107-108页
   ·后续的研究工作第108-111页
参考文献第111-117页
在读期间发表的学术论文与取得的研究成果第117-119页
致谢第119-120页

论文共120页,点击 下载论文
上一篇:基于深层神经网络的声学特征提取及其在LVCSR系统中的应用
下一篇:基于电流驱动无源混频器的宽带接收机关键技术研究