摘要 | 第1-6页 |
ABSTRACT | 第6-8页 |
目录 | 第8-11页 |
表格索引 | 第11-13页 |
插图索引 | 第13-15页 |
第一章 绪论 | 第15-23页 |
·声音转换概述 | 第15-16页 |
·声音转换技术 | 第15-16页 |
·研究意义和应用价值 | 第16页 |
·声音转换研究现状分析 | 第16-20页 |
·论文研究目标和研究内容 | 第20-21页 |
·论文结构安排 | 第21-23页 |
第二章 声音转换关键技术 | 第23-41页 |
·声音转换的语音学基础 | 第23-24页 |
·语音的发音机理 | 第23-24页 |
·语音中说话人相关特征 | 第24页 |
·语音分析/合成器 | 第24-25页 |
·特征提取 | 第25-26页 |
·特征序列对齐 | 第26-27页 |
·特征转换 | 第27-28页 |
·韵律特征转换 | 第27-28页 |
·频谱特征转换 | 第28页 |
·基于高斯混合模型的频谱特征转换方法 | 第28-30页 |
·算法原理 | 第28-30页 |
·过平滑效应问题分析 | 第30页 |
·基于神经网络的频谱特征转换方法 | 第30-38页 |
·传统建模方法 | 第30-32页 |
·研究新进展 | 第32-38页 |
·建模特点分析 | 第38页 |
·转换语音效果评价方法 | 第38-39页 |
·客观评价方法 | 第39页 |
·主观评价方法 | 第39页 |
·本章小结 | 第39-41页 |
第三章 基于双向联想贮存器的频谱包络联合特征建模方法 | 第41-51页 |
·双向联想贮存器模型简介 | 第41-42页 |
·基于双向联想贮存器的频谱包络联合特征建模 | 第42-50页 |
·基本原理 | 第42-43页 |
·参数估计 | 第43-44页 |
·系统搭建 | 第44-45页 |
·实验条件 | 第45-46页 |
·实验结果 | 第46-50页 |
·本章小结 | 第50-51页 |
第四章 基于逐层产生式训练的深度神经网络的频谱包络转换方法 | 第51-63页 |
·基于逐层产生式训练的深度神经网络的频谱包络转换方法原理 | 第51-53页 |
·实验条件 | 第53-54页 |
·实验结果与分析 | 第54-62页 |
·RBM和GBAM建模能力分析 | 第54-58页 |
·与FTDNN的转换效果对比 | 第58页 |
·GTDNN模型的频谱包络转换效果分析 | 第58-60页 |
·与GMM-GV系统转换效果对比 | 第60-62页 |
·本章小结 | 第62-63页 |
第五章 基于多源说话人数据训练的深度神经网络的频谱转换方法 | 第63-71页 |
·模型原理 | 第63-65页 |
·单目标深度神经网络训练原理 | 第64页 |
·多目标深度神经网络训练原理 | 第64-65页 |
·实验条件 | 第65-66页 |
·实验结果与分析 | 第66-68页 |
·作为源说话人无关模型转换效果分析 | 第66-67页 |
·作为DNN初始化模型性能 | 第67-68页 |
·本章小结 | 第68-71页 |
第六章 总结与展望 | 第71-73页 |
参考文献 | 第73-79页 |
致谢 | 第79-81页 |
在读期间发表的学术论文与取得的研究成果 | 第81-82页 |