基于深层神经网络模型的浅层语义解析统计研究
摘要 | 第3-5页 |
Abstract | 第5-6页 |
第1章 绪论 | 第10-26页 |
1.1 研究背景 | 第10-15页 |
1.2 研究意义 | 第15页 |
1.3 国内外研究现状 | 第15-20页 |
1.3.1 词的特征表示方法 | 第15-17页 |
1.3.2 中间意义识别 | 第17-20页 |
1.4 研究述评 | 第20-22页 |
1.4.1 词特征表示研究述评 | 第21页 |
1.4.2 中间意义识别研究述评 | 第21-22页 |
1.5 研究框架及主要创新 | 第22-26页 |
1.5.1 研究框架 | 第22-24页 |
1.5.2 主要创新 | 第24-26页 |
第2章 浅层语义解析的形式化表示 | 第26-35页 |
2.1 浅层语义解析 | 第26-30页 |
2.1.1 词性 | 第26页 |
2.1.2 句法 | 第26-27页 |
2.1.3 词义 | 第27-28页 |
2.1.4 部分词项的语义关系 | 第28-30页 |
2.2 形式化表示 | 第30-35页 |
2.2.1 句级别序列标注问题 | 第30页 |
2.2.2 一个词级别序列标注问题 | 第30-32页 |
2.2.3 多个词级别序列标注问题 | 第32-35页 |
第3章 词向量模型 | 第35-48页 |
3.1 理论和方法依据 | 第35-38页 |
3.1.1 分布式假定 | 第35-36页 |
3.1.2 统计量的选择 | 第36页 |
3.1.3 多维尺度分析 | 第36-38页 |
3.2 词向量模型的理论研究 | 第38-42页 |
3.2.1 LSA模型 | 第38-39页 |
3.2.2 word2vec模型 | 第39-41页 |
3.2.3 glove模型 | 第41-42页 |
3.3 词向量模型的效果评估 | 第42-48页 |
3.3.1 评估准则 | 第42-43页 |
3.3.2 语料库和模型选择 | 第43-44页 |
3.3.3 模型效果评估 | 第44-48页 |
第4章 一类深层神经网络模型 | 第48-71页 |
4.1 基本概念 | 第48-51页 |
4.1.1 人工神经元 | 第48-49页 |
4.1.2 神经网络模型 | 第49-51页 |
4.2 有关模型组件的理论和方法研究 | 第51-63页 |
4.2.1 卷积层和池化层 | 第51-54页 |
4.2.2 LSTM层 | 第54-61页 |
4.2.3 注意力机制层 | 第61-62页 |
4.2.4 全局优化层 | 第62-63页 |
4.3 一类深层神经网络模型 | 第63-71页 |
4.3.1 基本模型 | 第64-66页 |
4.3.2 基本模型的扩展 | 第66-68页 |
4.3.3 系统性设计 | 第68-71页 |
第5章 深层神经网络模型的参数估计 | 第71-91页 |
5.1 误差反向传播算法 | 第71-74页 |
5.1.1 最速下降法 | 第71-72页 |
5.1.2 在线学习 | 第72页 |
5.1.3 随机梯度下降算法 | 第72-73页 |
5.1.4 BP算法 | 第73-74页 |
5.2 梯度计算 | 第74-79页 |
5.2.1 全局优化层的梯度计算公式 | 第75-77页 |
5.2.2 LSTM层的梯度计算公式 | 第77-78页 |
5.2.3 卷积层和池化层的梯度计算公式 | 第78-79页 |
5.3 算法的改进 | 第79-84页 |
5.3.1 小批次随机梯度下降算法 | 第80-81页 |
5.3.2 经典动量算法 | 第81-84页 |
5.4 实证研究 | 第84-91页 |
5.4.1 模型组件的识别效果分析 | 第86-87页 |
5.4.2 内在关联性的效果分析 | 第87-89页 |
5.4.3 不同模型的比较研究 | 第89-91页 |
第6章 应用研究 | 第91-103页 |
6.1 通用框架的两种适用情形 | 第91-92页 |
6.2 政府服务热线工单数据案例分析 | 第92-103页 |
6.2.1 样本数据的分类汇总 | 第93-94页 |
6.2.2 投诉类工单数据 | 第94-97页 |
6.2.3 咨询类工单数据 | 第97-103页 |
第7章 总结与展望 | 第103-105页 |
7.1 本文所做的主要工作 | 第103-104页 |
7.2 有待于进一步研究的问题 | 第104-105页 |
参考文献 | 第105-114页 |
攻读博士期间发表论文清单 | 第114-115页 |
攻读博士期间参与课题研究情况 | 第115-116页 |
致谢 | 第116-117页 |
附录1 全局优化层的代码 | 第117-124页 |
附录2 基本模型的构建代码 | 第124-127页 |