中文摘要 | 第4-5页 |
Abstract | 第5-6页 |
第一章 绪论 | 第13-19页 |
1.1 语音转换的定义 | 第13-14页 |
1.2 语音转换的研究意义与应用 | 第14-15页 |
1.3 课题国内外研究现状 | 第15-17页 |
1.4 课题研究目标及主要工作 | 第17页 |
1.5 论文结构安排 | 第17-19页 |
第二章 语音转换理论基础 | 第19-44页 |
2.1 语音信号的声学基础 | 第19-24页 |
2.1.1 语音发音系统 | 第19-20页 |
2.1.2 语音听觉机理 | 第20-21页 |
2.1.3 语音信号模型 | 第21-24页 |
2.2 语音信号分析 | 第24-36页 |
2.2.1 语音信号的预处理 | 第25-31页 |
2.2.2 基音周期估值 | 第31-33页 |
2.2.3 短时谱参数分析 | 第33-35页 |
2.2.4 语谱图 | 第35-36页 |
2.3 STRAIGHT语音分析模型 | 第36-38页 |
2.3.1 去除周期影响的谱估计 | 第37-38页 |
2.3.2 平滑可靠的基频轨迹提取 | 第38页 |
2.3.3 语音重构 | 第38页 |
2.4 语音转换的基本原理 | 第38-40页 |
2.4.1 语音转换系统组成 | 第38-39页 |
2.4.2 语音转换方法概述 | 第39-40页 |
2.5 语音转换性能评价标准 | 第40-43页 |
2.5.1 客观评价 | 第41页 |
2.5.2 主观评价 | 第41-43页 |
2.6 本章小结 | 第43-44页 |
第三章 基于传统稀疏非负矩阵分解的语音转换 | 第44-54页 |
3.1 非负矩阵分解基本思想 | 第44-46页 |
3.2 非负矩阵分解基本算法 | 第46-47页 |
3.2.1 目标函数 | 第46页 |
3.2.2 迭代规则 | 第46-47页 |
3.3 非负矩阵分解的变体 | 第47-49页 |
3.4 基于传统稀疏非负矩阵分解的语音转换 | 第49-53页 |
3.4.1 转换系统中心思想 | 第49页 |
3.4.2 转换系统构成 | 第49-50页 |
3.4.3 特征参数动态时间规整(DTW) | 第50-52页 |
3.4.4 激励矩阵 | 第52-53页 |
3.5 本章小结 | 第53-54页 |
第四章 基于聚类特征联合字典的语音转换 | 第54-64页 |
4.1 系统构成 | 第54-55页 |
4.2 联合字典的建立 | 第55-58页 |
4.2.1 多重动态时间规整(Multi-DTW) | 第55-57页 |
4.2.2 特征聚类选择 | 第57-58页 |
4.3 激励矩阵与字典权重系数 | 第58-61页 |
4.4 映射因子 | 第61-62页 |
4.5 基频参数转换 | 第62-63页 |
4.6 本章小结 | 第63-64页 |
第五章 语音转换实验结果与分析 | 第64-70页 |
5.1 语料库描述及参数设置 | 第64-65页 |
5.2 客观评价 | 第65-66页 |
5.3 主观评价 | 第66-68页 |
5.4 语谱图分析 | 第68-69页 |
5.5 本章小结 | 第69-70页 |
第六章 总结与展望 | 第70-72页 |
6.1 总结 | 第70-71页 |
6.2 展望 | 第71-72页 |
参考文献 | 第72-78页 |
攻读硕士学位期间公开发表的论文 | 第78-79页 |
缩略语对照表 | 第79-81页 |
致谢 | 第81页 |