摘要 | 第4-6页 |
ABSTRACT | 第6-8页 |
第一章 绪论 | 第16-24页 |
1.1 课题研究背景及意义 | 第16-18页 |
1.2 课题研究现状 | 第18-20页 |
1.2.1 合成语音检测特征 | 第18-19页 |
1.2.2 合成语音检测分类器 | 第19-20页 |
1.2.3 目前合成语音检测研究中的主要问题总结 | 第20页 |
1.3 本文的主要工作和研究成果 | 第20-22页 |
1.4 本文结构 | 第22-24页 |
第二章 合成语音检测算法基础 | 第24-48页 |
2.1 语音合成方法 | 第24-26页 |
2.2 合成语音检测算法评估数据库 | 第26-28页 |
2.3 合成语音检测特征 | 第28-38页 |
2.3.1 短时幅频特征 | 第28-32页 |
2.3.2 短时相频特征 | 第32-34页 |
2.3.3 基于神经网络的特征 | 第34-38页 |
2.4 合成语音检测分类器 | 第38-40页 |
2.4.1 LBP-SVM分类器 | 第38-39页 |
2.4.2 GMM-LLR分类器 | 第39-40页 |
2.5 常用的合成语音检测算法的表现 | 第40-47页 |
2.6 小结 | 第47-48页 |
第三章 基于加噪训练的鲁棒检测算法 | 第48-58页 |
3.1 引言 | 第48-49页 |
3.2 噪声对和合成语音检测的影响 | 第49-51页 |
3.3 基于语音增强的检测算法 | 第51-53页 |
3.4 基于加噪训练的检测算法 | 第53-54页 |
3.5 小结 | 第54-58页 |
第四章 基于深度神经网络滤波器倒谱系数特征的检测算法 | 第58-70页 |
4.1 引言 | 第58-59页 |
4.2 滤波器组学习神经网络的结构与约束条件 | 第59-65页 |
4.2.1 FBNN结构 | 第60-62页 |
4.2.2 FBNN的训练与约束 | 第62-63页 |
4.2.3 不同约束条件下获取的学习滤波器组 | 第63-65页 |
4.3 DNN-FBCC特征与人工设计FBCC特征的比较 | 第65-67页 |
4.4 DNN-FBCC特征与其他数据驱动特征的比较 | 第67-69页 |
4.5 小结 | 第69-70页 |
第五章 基于动态声学特征及深度神经网络的检测算法 | 第70-90页 |
5.1 引言 | 第70-71页 |
5.2 动态声学特征 | 第71-76页 |
5.2.1 FBCC特征 | 第71-73页 |
5.2.2 CQCC特征 | 第73-76页 |
5.3 DNN分类器与打分算法 | 第76-84页 |
5.3.1 DNN检测分类器 | 第77-78页 |
5.3.2 直接判定检测法 | 第78页 |
5.3.3 DNN-LLR打分法 | 第78页 |
5.3.4 DNN-GSL打分法 | 第78-80页 |
5.3.5 GSL打分法优越性证明 | 第80-84页 |
5.4 DNN分类器在合成语音检测上的表现 | 第84-86页 |
5.5 DNN分类器的实验结果分析 | 第86-88页 |
5.6 小结 | 第88-90页 |
第六章 合成语音检测算法与说话人认证系统的融合 | 第90-108页 |
6.1 说话人认证系统 | 第90-101页 |
6.1.1 说话人认证系统概述 | 第90-91页 |
6.1.2 说人认证系统架构 | 第91-92页 |
6.1.3 常用说话人认证系统建模方案 | 第92-101页 |
6.2 合成语音攻击对说话人认证系统的影响 | 第101-104页 |
6.3 合成语音检测算法与说话人认证系统融合方案 | 第104-105页 |
6.4 融合系统对合成语音攻击的抵抗能力 | 第105-107页 |
6.5 小结 | 第107-108页 |
第七章 总结与展望 | 第108-112页 |
7.1 论文的工作总结 | 第108-109页 |
7.2 研究展望 | 第109-112页 |
附录A 缩略语表 | 第112-116页 |
参考文献 | 第116-124页 |
致谢 | 第124-126页 |
攻读学位期间发表的学术论文目录 | 第126页 |