| 摘要 | 第1-7页 |
| ABSTRACT | 第7-12页 |
| 第1章 绪论-个性化语音生成与说话人特征 | 第12-24页 |
| ·说话人发音机理 | 第12-16页 |
| ·语音产生的生理机理 | 第12-13页 |
| ·语音产生的数学模型 | 第13-16页 |
| ·说话人识别与说话人特征参数 | 第16-20页 |
| ·说话人识别 | 第16-18页 |
| ·说话人特征参数和分类 | 第18-20页 |
| ·个性化语音生成实用需求 | 第20-22页 |
| ·实际使用中能够获得的输入信息 | 第20-21页 |
| ·用户对生成语音自然度的要求 | 第21页 |
| ·用户对生成语音与目标说话人相似度的需求 | 第21-22页 |
| ·用户的配合度和可以获得的训练语料的数量 | 第22页 |
| ·拥有的计算资源和实时性需求 | 第22页 |
| 小结 | 第22-24页 |
| 第2章 经典说话人转换方法分析 | 第24-48页 |
| ·基于 GMM 的转换方法 | 第25-32页 |
| ·GMM 方法的主要训练方法 | 第26-30页 |
| ·GMM 方法的转换过程及结果评价 | 第30-32页 |
| ·码本映射方法 | 第32-41页 |
| ·经典的码本映射方法 | 第32-35页 |
| ·STASC 码本映射方法 | 第35-41页 |
| ·GMM 方法与 STASC 码本映射方法的联系与区别 | 第41-43页 |
| ·相同的训练数据的准备 | 第41页 |
| ·不同的训练思路 | 第41-43页 |
| ·GMM 方法和码本映射方法问题分析 | 第43-46页 |
| ·对应源和目标数据的不匹配问题 | 第43-45页 |
| ·转换语音的过平滑问题 | 第45-46页 |
| 小结 | 第46-48页 |
| 第3章 基于映射共振峰的频谱弯曲方法 | 第48-68页 |
| ·基于频谱弯曲的说话人转换方法 | 第48-50页 |
| ·基于映射共振峰的转换方法 | 第50-57页 |
| ·基于映射共振峰的频谱弯曲函数训练 | 第50-54页 |
| ·频谱转换阶段 | 第54-55页 |
| ·基于频谱弯曲的说话人转换系统 | 第55-57页 |
| ·结合频谱弯曲方法和单元挑选的说话人转换算法 | 第57-62页 |
| ·训练阶段 | 第58-59页 |
| ·转换阶段 | 第59-62页 |
| ·说话人转换评测分析 | 第62-67页 |
| ·评测数据和测听人 | 第62页 |
| ·评测标准 | 第62-63页 |
| ·英文评测结果 | 第63-65页 |
| ·西班牙语评测结果 | 第65-67页 |
| 小结 | 第67-68页 |
| 第4章 个性化语音生成实现中英文混合语音合成系统 | 第68-96页 |
| ·基于隐马尔可夫模型的语音合成介绍 | 第69-71页 |
| ·中英文模型训练 | 第71-82页 |
| ·训练参数设置 | 第72-73页 |
| ·以音节为单位的中文模型训练 | 第73-80页 |
| ·以音素为单位的英文模型训练 | 第80-82页 |
| ·清浊判决修正 | 第82-85页 |
| ·英文频谱模型最大似然自适应和韵律整体调整 | 第85-90页 |
| ·最大似然自适应训练 | 第85-89页 |
| ·英文频谱和韵律模型 | 第89-90页 |
| ·合成时中英文共享的韵律结构 | 第90-91页 |
| ·合成语音对比评测及讨论 | 第91-94页 |
| ·系统介绍 | 第91页 |
| ·评测标准 | 第91-92页 |
| ·测试句、测听方法和评测人员 | 第92-93页 |
| ·评测结果和讨论 | 第93-94页 |
| 小结 | 第94-96页 |
| 第5章 总结与展望 | 第96-98页 |
| 参考文献 | 第98-102页 |
| 在读期间发表的学术论文与取得的其他研究成果 | 第102-104页 |
| 致谢 | 第104-105页 |