摘要 | 第1-7页 |
ABSTRACT | 第7-12页 |
第1章 绪论-个性化语音生成与说话人特征 | 第12-24页 |
·说话人发音机理 | 第12-16页 |
·语音产生的生理机理 | 第12-13页 |
·语音产生的数学模型 | 第13-16页 |
·说话人识别与说话人特征参数 | 第16-20页 |
·说话人识别 | 第16-18页 |
·说话人特征参数和分类 | 第18-20页 |
·个性化语音生成实用需求 | 第20-22页 |
·实际使用中能够获得的输入信息 | 第20-21页 |
·用户对生成语音自然度的要求 | 第21页 |
·用户对生成语音与目标说话人相似度的需求 | 第21-22页 |
·用户的配合度和可以获得的训练语料的数量 | 第22页 |
·拥有的计算资源和实时性需求 | 第22页 |
小结 | 第22-24页 |
第2章 经典说话人转换方法分析 | 第24-48页 |
·基于 GMM 的转换方法 | 第25-32页 |
·GMM 方法的主要训练方法 | 第26-30页 |
·GMM 方法的转换过程及结果评价 | 第30-32页 |
·码本映射方法 | 第32-41页 |
·经典的码本映射方法 | 第32-35页 |
·STASC 码本映射方法 | 第35-41页 |
·GMM 方法与 STASC 码本映射方法的联系与区别 | 第41-43页 |
·相同的训练数据的准备 | 第41页 |
·不同的训练思路 | 第41-43页 |
·GMM 方法和码本映射方法问题分析 | 第43-46页 |
·对应源和目标数据的不匹配问题 | 第43-45页 |
·转换语音的过平滑问题 | 第45-46页 |
小结 | 第46-48页 |
第3章 基于映射共振峰的频谱弯曲方法 | 第48-68页 |
·基于频谱弯曲的说话人转换方法 | 第48-50页 |
·基于映射共振峰的转换方法 | 第50-57页 |
·基于映射共振峰的频谱弯曲函数训练 | 第50-54页 |
·频谱转换阶段 | 第54-55页 |
·基于频谱弯曲的说话人转换系统 | 第55-57页 |
·结合频谱弯曲方法和单元挑选的说话人转换算法 | 第57-62页 |
·训练阶段 | 第58-59页 |
·转换阶段 | 第59-62页 |
·说话人转换评测分析 | 第62-67页 |
·评测数据和测听人 | 第62页 |
·评测标准 | 第62-63页 |
·英文评测结果 | 第63-65页 |
·西班牙语评测结果 | 第65-67页 |
小结 | 第67-68页 |
第4章 个性化语音生成实现中英文混合语音合成系统 | 第68-96页 |
·基于隐马尔可夫模型的语音合成介绍 | 第69-71页 |
·中英文模型训练 | 第71-82页 |
·训练参数设置 | 第72-73页 |
·以音节为单位的中文模型训练 | 第73-80页 |
·以音素为单位的英文模型训练 | 第80-82页 |
·清浊判决修正 | 第82-85页 |
·英文频谱模型最大似然自适应和韵律整体调整 | 第85-90页 |
·最大似然自适应训练 | 第85-89页 |
·英文频谱和韵律模型 | 第89-90页 |
·合成时中英文共享的韵律结构 | 第90-91页 |
·合成语音对比评测及讨论 | 第91-94页 |
·系统介绍 | 第91页 |
·评测标准 | 第91-92页 |
·测试句、测听方法和评测人员 | 第92-93页 |
·评测结果和讨论 | 第93-94页 |
小结 | 第94-96页 |
第5章 总结与展望 | 第96-98页 |
参考文献 | 第98-102页 |
在读期间发表的学术论文与取得的其他研究成果 | 第102-104页 |
致谢 | 第104-105页 |