摘要 | 第5-6页 |
Abstract | 第6-7页 |
第1章 绪论 | 第12-26页 |
1.1 研究背景及意义 | 第12-20页 |
1.2 国内外研究现状 | 第20-23页 |
1.3 本文研究目标和研究内容 | 第23-24页 |
1.4 本文结构安排 | 第24-26页 |
第2章 RNN-BLSTM声学模型 | 第26-34页 |
2.1 引言 | 第26-27页 |
2.2 RNN-BLSTM简介 | 第27-30页 |
2.3 基于延时控制的RNN-BLSTM训练方法 | 第30-31页 |
2.4 实验 | 第31-33页 |
2.4.1 TIMIT任务 | 第31-32页 |
2.4.2 switchboard任务 | 第32-33页 |
2.5 本章小结 | 第33-34页 |
第3章 基于说话人编码的RNN-BLSTM声学模型上的说话人自适应方法 | 第34-50页 |
3.1 引言 | 第34-35页 |
3.2 基于说话人编码的说话人自适应方法 | 第35-41页 |
3.2.1 DNN-HMM声学模型上的说话人编码自适应模型 | 第35-37页 |
3.2.2 RNN-BLSTM声学模型上的说话人编码自适应模型 | 第37-39页 |
3.2.3 基于层宽的规整算法 | 第39-40页 |
3.2.4 基于奇异值分解的模型压缩算法 | 第40-41页 |
3.3 基于鉴别性矢量的说话人自适应方法 | 第41-43页 |
3.3.1 鉴别性矢量的提取 | 第41-42页 |
3.3.2 RNN-BLSTM声学模型上的鉴别性矢量自适应模型 | 第42-43页 |
3.4 实验 | 第43-48页 |
3.4.1 TIMIT任务 | 第43-46页 |
3.4.2 switchboard任务 | 第46-48页 |
3.5 本章小结 | 第48-50页 |
第4章 基于深层编码的RNN-BLSTM声学模型上的离线说话人自适应方法 | 第50-60页 |
4.1 引言 | 第50-51页 |
4.2 基于深层编码的离线说话人自适应方法 | 第51-56页 |
4.2.1 离线深层编码提取 | 第51-54页 |
4.2.2 说话人聚类 | 第54-55页 |
4.2.3 深层编码的插值算法 | 第55-56页 |
4.3 实验 | 第56-59页 |
4.4 本章小结 | 第59-60页 |
第5章 基于深层编码的RNN-BLSTM声学模型上的在线说话人自适应方法 | 第60-68页 |
5.1 引言 | 第60-61页 |
5.2 基于深层编码的在线说话人自适应方法 | 第61-64页 |
5.2.1 在线深层编码提取 | 第61-63页 |
5.2.2 在线深层编码融合 | 第63-64页 |
5.3 基于i-vector的在线说话人自适应方法 | 第64页 |
5.4 实验 | 第64-66页 |
5.5 本章小结 | 第66-68页 |
第6章 总结和展望 | 第68-70页 |
参考文献 | 第70-80页 |
致谢 | 第80-82页 |
在读期间发表的学术论文与取得的研究成果 | 第82-83页 |