摘要 | 第4-5页 |
Abstract | 第5-6页 |
1 绪论 | 第13-21页 |
1.1 引言 | 第13-14页 |
1.2 研究现状 | 第14-18页 |
1.2.1 特征层面 | 第14-16页 |
1.2.2 模型层面 | 第16-17页 |
1.2.3 汉语方言层面 | 第17-18页 |
1.3 存在问题 | 第18-19页 |
1.4 评价标准 | 第19-20页 |
1.5 结构安排 | 第20-21页 |
2 汉语方言语音库构建 | 第21-29页 |
2.1 引言 | 第21-23页 |
2.2 语音库构建标准设计 | 第23-24页 |
2.2.1 语料准则设计 | 第23页 |
2.2.2 语料方案设计 | 第23页 |
2.2.3 话者选择 | 第23-24页 |
2.3 语音采集与管理 | 第24-27页 |
2.3.1 语音录制 | 第24页 |
2.3.2 数据管理 | 第24-27页 |
2.4 数据统计与分析 | 第27-28页 |
2.4.1 数据预处理 | 第27页 |
2.4.2 实验数据 | 第27-28页 |
2.5 小结 | 第28-29页 |
3 基于全局信息的方言特征融合 | 第29-39页 |
3.1 引言 | 第29-30页 |
3.2 全局特征融合 | 第30-34页 |
3.2.1 I-vector特征提取 | 第30-31页 |
3.2.2 韵律特征提取 | 第31-33页 |
3.2.3 特征融合 | 第33-34页 |
3.3 基于融合特征的汉语方言辨识 | 第34-35页 |
3.3.1 概率线性鉴别性分析 | 第34-35页 |
3.3.2 对数似然比打分 | 第35页 |
3.4 实验设计与分析 | 第35-37页 |
3.4.1 I-vector与GMM-UBM辨识性能对比 | 第35-36页 |
3.4.2 融合韵律信息前后辨识性能对比 | 第36-37页 |
3.5 小结 | 第37-39页 |
4 基于深度关注神经网络的模型设计 | 第39-53页 |
4.1 引言 | 第39-40页 |
4.2 DNN模型训练 | 第40-45页 |
4.2.1 限制玻尔兹曼机 | 第40-42页 |
4.2.2 深度置信网络 | 第42页 |
4.2.3 自动编码器 | 第42-44页 |
4.2.4 鉴别性预训练 | 第44-45页 |
4.3 基于深度关注神经网络的汉语方言辨识 | 第45-48页 |
4.3.1 分心模型 | 第46页 |
4.3.2 关注模型 | 第46-47页 |
4.3.3 基于关注机制的DNN模型 | 第47-48页 |
4.4 实验设计与分析 | 第48-51页 |
4.4.1 基于MFCC的关注模型 | 第49页 |
4.4.2 基于GSV的关注模型 | 第49-51页 |
4.5 小结 | 第51-53页 |
5 总结与展望 | 第53-55页 |
5.1 主要工作 | 第53-54页 |
5.2 工作展望 | 第54-55页 |
附录 | 第55-61页 |
参考文献 | 第61-69页 |
致谢 | 第69-71页 |
作者简历 | 第71-73页 |
学位论文数据集 | 第73页 |