中文摘要 | 第3-4页 |
Abstract | 第4页 |
第1章 绪论 | 第9-18页 |
1.1 研究目的和意义 | 第9-11页 |
1.2 相关研究综述 | 第11-16页 |
1.2.1 立场检测研究现状 | 第11-14页 |
1.2.2 回复生成研究现状 | 第14-16页 |
1.3 本文主要研究内容 | 第16-17页 |
1.4 本文的组织安排 | 第17-18页 |
第2章 中文短文本对话立场检测语料构建 | 第18-37页 |
2.1 引言 | 第18-19页 |
2.2 新浪微博中的短文本对话 | 第19-21页 |
2.3 立场检测语料库构建流程 | 第21-23页 |
2.4 语料清洗 | 第23-24页 |
2.5 立场倾向伪标注 | 第24-25页 |
2.6 语料库相关术语定义 | 第25-28页 |
2.6.1 话题的定义 | 第25-26页 |
2.6.2 立场的定义 | 第26-27页 |
2.6.3 情感极性定义及其与立场倾向的联系 | 第27-28页 |
2.7 语料库标注规范 | 第28-33页 |
2.7.1 立场倾向标注规范 | 第28-31页 |
2.7.2 情感极性标注难点及其标注规范 | 第31-33页 |
2.8 语料库质量评估及统计分析 | 第33-36页 |
2.8.1 语料库质量评估 | 第33-35页 |
2.8.2 语料库统计分析 | 第35-36页 |
2.9 本章小结 | 第36-37页 |
第3章 短文本对话立场检测方法研究 | 第37-50页 |
3.1 引言 | 第37-38页 |
3.2 短文本对话立场检测任务 | 第38-39页 |
3.3 基于稀疏特征表示的立场检测 | 第39-41页 |
3.3.1 特征选择与表示 | 第39页 |
3.3.2 基于神经网络最大熵模型的立场检测 | 第39-41页 |
3.4 基于稠密特征表示的立场检测 | 第41-45页 |
3.4.1 基于CNN的立场检测 | 第41-42页 |
3.4.2 基于Bi-LSTM的立场检测 | 第42-44页 |
3.4.3 融合话题和情感信息的立场检测 | 第44-45页 |
3.4.4 神经网络模型参数训练方法 | 第45页 |
3.5 实验结果与分析 | 第45-49页 |
3.5.1 实验数据和评价指标 | 第45-46页 |
3.5.2 不同方法的短文本对话立场检测实验结果 | 第46-47页 |
3.5.3 情感信息对短文本对话立场检测的影响 | 第47-48页 |
3.5.4 立场信息对情感分类的影响 | 第48-49页 |
3.6 本章小结 | 第49-50页 |
第4章 基于立场的短文本对话回复生成 | 第50-61页 |
4.1 引言 | 第50-51页 |
4.2 短文本回复生成问题 | 第51-52页 |
4.3 基于转移的回复生成系统框架 | 第52-54页 |
4.4 基于转移的回复生成编码方法 | 第54-56页 |
4.4.1 融入立场倾向的微博文本编码算法 | 第54-55页 |
4.4.2 不同循环神经网络结构的微博文本编码算法 | 第55-56页 |
4.5 基于转移的回复生成解码方法 | 第56-58页 |
4.5.1 回复生成搜索算法 | 第56-57页 |
4.5.2 立场驱动的增量式回复生成解码算法 | 第57-58页 |
4.6 模型参数训练方法 | 第58-59页 |
4.7 实验结果与分析 | 第59-60页 |
4.7.1 实验设置 | 第59-60页 |
4.7.2 立场驱动的回复生成实验结果 | 第60页 |
4.8 本章小结 | 第60-61页 |
结论 | 第61-63页 |
参考文献 | 第63-70页 |
致谢 | 第70-71页 |
攻读硕士学位期间发表的学术论文及参加的科研项目 | 第71-72页 |