摘要 | 第1-7页 |
ABSTRACT | 第7-9页 |
目录 | 第9-12页 |
插图 | 第12-14页 |
表格 | 第14-15页 |
第一章 绪论 | 第15-23页 |
·说话人转换的定义 | 第16-17页 |
·说话人转换的意义 | 第17-18页 |
·理论研究意义 | 第17页 |
·实际应用意义 | 第17-18页 |
·说话人转换技术的研究历史与现状 | 第18-21页 |
·本论文的研究目标和内容概述 | 第21-23页 |
第二章 说话人转换系统介绍 | 第23-47页 |
·说话人的个性特征 | 第23-27页 |
·语音产生过程 | 第23-25页 |
·影响说话人的个性特征的本质因素 | 第25-27页 |
·典型的说话人转换系统 | 第27-37页 |
·系统构成 | 第27-28页 |
·语音分析与合成 | 第28-33页 |
·特征对齐 | 第33-35页 |
·特征转换 | 第35-37页 |
·基于GMM的频谱转换方法 | 第37-45页 |
·高斯混合模型 | 第37-38页 |
·基于最小均方误差准则的方法 | 第38-40页 |
·最大后验概率模型训练方法 | 第40-41页 |
·基于最大输出概率的转换方法 | 第41-44页 |
·说话人转换方法的评价方法 | 第44-45页 |
·本文的出发点 | 第45-46页 |
·本章小结 | 第46-47页 |
第三章 融合独立转换函数的联合空间频谱建模与转换 | 第47-69页 |
·并行数据上的模型训练与转换 | 第49-54页 |
·模型训练 | 第49-51页 |
·实验及分析 | 第51-53页 |
·小结 | 第53-54页 |
·非并行数据上的模型训练与转换 | 第54-63页 |
·模型训练 | 第54-56页 |
·基于频率弯折的性能改善 | 第56-59页 |
·实验及分析 | 第59-63页 |
·小结 | 第63页 |
·动态特征提取窗系数的研究 | 第63-68页 |
·实验及分析 | 第66-68页 |
·小结 | 第68页 |
·本章小结 | 第68-69页 |
第四章 基于说话人信息与内容信息分别建模的转换方法 | 第69-97页 |
·基于话者无关空间的建模转换方法 | 第70-83页 |
·说话人无关模型 | 第70-75页 |
·使用话者无关模型构造说话人转换系统 | 第75-76页 |
·实验及分析 | 第76-82页 |
·小结 | 第82-83页 |
·基于深层神经网络的说话人与内容分离及其在说话人转换中的应用 | 第83-96页 |
·深层神经网络 | 第84-85页 |
·深层神经网络的初始化 | 第85页 |
·深层置信网络 | 第85页 |
·堆叠的自动编码器 | 第85-87页 |
·说话人信息和内容信息分离的网络 | 第87-96页 |
·小结 | 第96页 |
·本章小结 | 第96-97页 |
第五章 基于受限玻尔兹曼机的频谱建模与转换 | 第97-115页 |
·受限波尔兹曼机 | 第99-103页 |
·模型介绍 | 第99-101页 |
·模型训练 | 第101页 |
·模型评估 | 第101-102页 |
·RBM的模式 | 第102-103页 |
·RBM在声学特征上的建模能力 | 第103页 |
·RBM在说话人转换中的应用 | 第103-113页 |
·实验及分析 | 第108-113页 |
·本章小结 | 第113-115页 |
第六章 总结 | 第115-119页 |
·本文的主要贡献与创新点 | 第115-116页 |
·后续的研究工作 | 第116-119页 |
参考文献 | 第119-127页 |
在读期间发表的学术论文与取得的研究成果 | 第127-129页 |
致谢 | 第129页 |