说话人转换方法的研究
摘要 | 第1-7页 |
ABSTRACT | 第7-15页 |
第一章 绪论 | 第15-27页 |
·语音技术的发展 | 第15-16页 |
·问题的描述 | 第16-18页 |
·说话人转换研究的历史 | 第18-21页 |
·说话人转换的研究意义和应用 | 第21-25页 |
·研究意义 | 第21-22页 |
·应用 | 第22-25页 |
·论文研究课题的来源及主要内容 | 第25-27页 |
第二章 说话人转换的基本原理与方法 | 第27-49页 |
·语音信号的基本特性 | 第27-32页 |
·语音信号的产生模型 | 第27-30页 |
·语音信号的说话人特征 | 第30-32页 |
·说话人识别的研究 | 第32页 |
·说话人转换系统的构成 | 第32-37页 |
·语音参数 | 第34-35页 |
·转换函数 | 第35-36页 |
·语音库 | 第36-37页 |
·说话人转换的评价标准 | 第37-38页 |
·客观评价标准 | 第37-38页 |
·主观评价标准 | 第38页 |
·说话人转换的基本方法 | 第38-47页 |
·声道模型 | 第39-41页 |
·激励源模型 | 第41-42页 |
·时域基音同步叠加(TD-PSOLA)算法 | 第42-45页 |
·频域基音同步叠加(FD-PSOLA)算法 | 第45-47页 |
·本章小结 | 第47-49页 |
第三章 基于高斯混合模型的谱包络转换方法 | 第49-67页 |
·信号幅度的转换 | 第49-50页 |
·谱包络的分析 | 第50-53页 |
·转换函数的训练 | 第53-58页 |
·语音信号的时间对齐 | 第53-54页 |
·GMM模型的训练 | 第54-57页 |
·转换函数 | 第57-58页 |
·谱包络的转换 | 第58-59页 |
·合成语音 | 第59-60页 |
·实验与结果讨论 | 第60-65页 |
·实验的语音库 | 第60页 |
·性能指标 | 第60-61页 |
·实验结果 | 第61-64页 |
·非正式听觉测试 | 第64-65页 |
·结果讨论 | 第65页 |
·本章小结 | 第65-67页 |
第四章 基于残差预测的激励信号转换方法 | 第67-77页 |
·引言 | 第67-68页 |
·残差信号的分析 | 第68-69页 |
·残差预测的训练 | 第69-71页 |
·基于GMM的分类器 | 第70页 |
·残差码本 | 第70-71页 |
·残差预测的实现 | 第71-72页 |
·基于残差预测的说话人转换 | 第72-73页 |
·实验与结果讨论 | 第73-76页 |
·残差码本的有效性测试 | 第73页 |
·信噪比测试 | 第73-76页 |
·结果讨论 | 第76页 |
·本章小结 | 第76-77页 |
第五章 基于音素的说话人转换方法 | 第77-91页 |
·引言 | 第77页 |
·音素的标注 | 第77-82页 |
·Mel倒谱系数MFCC | 第78-81页 |
·Viterbi算法 | 第81-82页 |
·基于音素的高斯混合模型 | 第82-83页 |
·基于音素的转换方法 | 第83-85页 |
·基于音素的谱包络转换 | 第83-84页 |
·基于音素的残差预测 | 第84-85页 |
·实验与结果讨论 | 第85-90页 |
·语音库的音素标注 | 第85-88页 |
·实验结果 | 第88-90页 |
·本章小结 | 第90-91页 |
第六章 跨语种说话人转换的初步研究 | 第91-104页 |
·引言 | 第91-94页 |
·汉语与英语的比较 | 第94-96页 |
·汉语音素 | 第94-96页 |
·汉语和英语音素的比较 | 第96页 |
·音节分类算法 | 第96-99页 |
·自动音节分类 | 第96-98页 |
·音节分类的映射 | 第98-99页 |
·声道长度归一化 | 第99-100页 |
·参数训练 | 第99-100页 |
·说话人转换 | 第100页 |
·实验结果 | 第100-103页 |
·自动音节分类实验 | 第101-102页 |
·分类映射实验 | 第102-103页 |
·本章小结 | 第103-104页 |
结论 | 第104-106页 |
参考文献 | 第106-114页 |
攻读学位期间发表的与学位论文内容相关的学术论文 | 第114-115页 |
致谢 | 第115页 |