中文摘要 | 第4-6页 |
Abstract | 第6-7页 |
第一章 绪论 | 第11-17页 |
1.1 语音转换的定义 | 第11-12页 |
1.2 语音转换研究的意义与发展应用 | 第12-13页 |
1.3 课题的国内外研究现状以及存在的问题 | 第13-14页 |
1.4 课题研究目标及主要工作 | 第14-15页 |
1.5 论文的结构安排 | 第15-17页 |
第二章 语音转换的理论基础 | 第17-42页 |
2.1 语音信号的基础知识 | 第17-21页 |
2.1.1 语音发音系统 | 第17-18页 |
2.1.2 语音信号的数学模型 | 第18-21页 |
2.2 语音的个性特征分析 | 第21-22页 |
2.3 语音信号分析 | 第22-31页 |
2.3.1 语音信号的预处理 | 第22-26页 |
2.3.2 端点检测 | 第26-27页 |
2.3.3 基音周期估计 | 第27-28页 |
2.3.4 语音信号的线性预测分析 | 第28-31页 |
2.4 语音分析-合成平台 STRAIGHT | 第31-37页 |
2.4.1 去除周期性影响的谱估计 | 第32-34页 |
2.4.2 平滑可靠的基频轨迹的提取 | 第34页 |
2.4.3 语音重构 | 第34-36页 |
2.4.4 STRAIGHT 谱包络的降维处理 | 第36-37页 |
2.5 语音转换系统原理 | 第37-38页 |
2.6 语音转换性能的评价标准 | 第38-42页 |
2.6.1 客观评价方法 | 第38-40页 |
2.6.2 主观评价方法 | 第40-42页 |
第三章 平行语料联合训练的语音转换方法 | 第42-52页 |
3.1 语音转换系统概述 | 第42页 |
3.2 语音转换的主要方法 | 第42-44页 |
3.2.1 矢量量化方法 | 第42页 |
3.2.2 说话人插值方法 | 第42-43页 |
3.2.3 神经网络方法 | 第43-44页 |
3.2.4 线性多变量回归方法 | 第44页 |
3.3 GMM 语音转换系统 | 第44-51页 |
3.3.1 语音信号的动态时间规整 | 第45-47页 |
3.3.2 GMM 模型的基本概念 | 第47-48页 |
3.3.3 GMM 模型的训练 | 第48-49页 |
3.3.4 GMM 模型训练的参数设置 | 第49-50页 |
3.3.5 GMM 模型的转换函数 | 第50-51页 |
3.4 传统语音转换系统的不足 | 第51-52页 |
第四章 倒谱本征空间结构化高斯混合模型的语音转换方法 | 第52-60页 |
4.1 语音转换系统结构 | 第52-53页 |
4.2 倒谱本征空间 | 第53-56页 |
4.2.1 倒谱本征空间的构成 | 第54-55页 |
4.2.2 倒谱本征空间的特性 | 第55-56页 |
4.3 倒谱本征空间 SGMM-ES 训练与转换函数推导 | 第56-60页 |
4.3.1 SGMM-ES 训练 | 第56-57页 |
4.3.2 SGMM-ES 与 AUS 对准 | 第57-58页 |
4.3.3 转换函数的推导 | 第58-60页 |
第五章 语音转换实验及分析 | 第60-66页 |
5.1 实验语料库的设计 | 第60页 |
5.2 客观评价实验 | 第60-62页 |
5.2.1 说话人识别测试 | 第60-61页 |
5.2.2 谱失真测度 | 第61-62页 |
5.3 主观评价实验 | 第62-63页 |
5.3.1 ABX 测试 | 第62页 |
5.3.2 MOS 评测 | 第62-63页 |
5.4 语谱图分析 | 第63-66页 |
第六章 总结与展望 | 第66-68页 |
6.1 总结 | 第66页 |
6.2 展望 | 第66-68页 |
参考文献 | 第68-72页 |
攻读硕士学位期间公开发表的论文 | 第72-73页 |
致谢 | 第73-74页 |