基于深度学习的与文本无关话者确认研究
摘要 | 第1-7页 |
ABSTRACT | 第7-13页 |
第一章 绪论 | 第13-25页 |
·引言 | 第13页 |
·说话人确认研究概述 | 第13-16页 |
·说话人确认研究的意义 | 第14页 |
·说话人确认的发展和现状 | 第14-16页 |
·说话人确认的分类 | 第16页 |
·说话人确认系统总体框架 | 第16-21页 |
·前端处理 | 第17-19页 |
·说话人建模 | 第19-20页 |
·评估准则 | 第20-21页 |
·论文的主要研究内容 | 第21-25页 |
第二章 基于概率统计模型的说话人确认 | 第25-41页 |
·概述 | 第25-26页 |
·贝叶斯决策理论 | 第26-28页 |
·高斯混合模型 | 第28-33页 |
·高斯混合模型概述 | 第28页 |
·高斯混合模型的结构 | 第28-30页 |
·高斯混合模型的参数估计 | 第30-33页 |
·基于GMM-UBM的说话人确认 | 第33-37页 |
·GMM-UBM系统结构 | 第33-34页 |
·MAP自适应算法 | 第34-37页 |
·实验结果与分析 | 第37-39页 |
·实验语音库 | 第37页 |
·语音预处理 | 第37-38页 |
·特征提取 | 第38-39页 |
·混合度的影响 | 第39页 |
·本章小结 | 第39-41页 |
第三章 深度学习的基本理论 | 第41-59页 |
·概述 | 第41页 |
·神经网络发展历程 | 第41-42页 |
·深度神经网络结构 | 第42-45页 |
·DNN参数估计 | 第45-49页 |
·DNN训练中常见问题 | 第49-56页 |
·数据预处理 | 第50-51页 |
·模型初始化 | 第51-54页 |
·权值衰减策略 | 第54-55页 |
·Momentum策略 | 第55页 |
·Dropout策略 | 第55-56页 |
·DNN隐藏层的作用 | 第56-58页 |
·本章小结 | 第58-59页 |
第四章 基于DNN的说话人确认 | 第59-69页 |
·引言 | 第59页 |
·基于DNN-SPK的说话人确认 | 第59-65页 |
·DNN作为特征提取器 | 第60-61页 |
·注册和测试 | 第61-62页 |
·实验与分析 | 第62-65页 |
·基于GMM-DNN的说话人确认 | 第65-68页 |
·系统结构 | 第65-66页 |
·注册和测试 | 第66-67页 |
·实验与分析 | 第67-68页 |
·本章小结 | 第68-69页 |
第五章 基于LSTM的说话人确认 | 第69-83页 |
·引言 | 第69页 |
·RNN的简单介绍 | 第69-73页 |
·单向RNN | 第70-71页 |
·双向RNN | 第71-73页 |
·LSTM | 第73-78页 |
·网络结构 | 第74-75页 |
·网络训练 | 第75-77页 |
·改进型LSTM | 第77-78页 |
·基于LSTM的说话人确认 | 第78-81页 |
·系统结构 | 第78-79页 |
·注册和测试 | 第79页 |
·实验与分析 | 第79-81页 |
·本章小结 | 第81-83页 |
第六章 总结与展望 | 第83-85页 |
参考文献 | 第85-89页 |
致谢 | 第89-91页 |
在读期间发表的学术论文与取得的研究成果 | 第91页 |