面向厦门旅游领域的自动问答系统
摘要 | 第4-5页 |
Abstract | 第5-6页 |
第一章 绪论 | 第13-21页 |
1.1 研究背景及意义 | 第13-15页 |
1.2 国内外研究现状 | 第15-18页 |
1.3 本文的结构 | 第18-21页 |
第二章 问答系统背景知识 | 第21-31页 |
2.1 自动问答系统的定义和分类 | 第21-22页 |
2.1.1 自动问答系统定义 | 第21页 |
2.1.2 问答系统的分类 | 第21-22页 |
2.2 问答系统的基本原理 | 第22-24页 |
2.2.1 问题处理模块 | 第23页 |
2.2.2 信息检索模块 | 第23-24页 |
2.2.3 答案抽取模块 | 第24页 |
2.3 问答系统的关键技术 | 第24-30页 |
2.3.1 分词 | 第24-25页 |
2.3.2 词性标注 | 第25-26页 |
2.3.3 命名实体识别 | 第26-28页 |
2.3.4 关键词提取 | 第28-29页 |
2.3.5 关键词扩展 | 第29-30页 |
2.4 小结 | 第30-31页 |
第三章 厦门旅游问句的分类 | 第31-49页 |
3.1 问句分类意义和作用 | 第31页 |
3.2 问句分类体系研究 | 第31-39页 |
3.2.1 基于答案类型的分类体系 | 第32-34页 |
3.2.2 旅游领域问句分类体系 | 第34-37页 |
3.2.3 厦门旅游问句分类体系 | 第37-39页 |
3.3 问句分类相关技术 | 第39-43页 |
3.3.1 特征选择方法 | 第39-42页 |
3.3.2 特征权重函数TF-IDF | 第42页 |
3.3.3 向量空间模型的问句表示法 | 第42-43页 |
3.4 问句分类方法 | 第43-45页 |
3.4.1 KNN分类法 | 第43-44页 |
3.4.2 支持向量机分类法 | 第44-45页 |
3.5 实验数据的采集 | 第45-46页 |
3.5.1 人工采集 | 第46页 |
3.5.2 网络爬虫 | 第46页 |
3.6 实现结果 | 第46-48页 |
3.6.1 关键词的提取与扩展 | 第46-47页 |
3.6.2 问句分类实验结果 | 第47-48页 |
3.7 小结 | 第48-49页 |
第四章 针对问句的微信文章检索实现 | 第49-59页 |
4.1 引言 | 第49页 |
4.2 Lucene全文检索 | 第49-52页 |
4.2.1 Lucene简介 | 第49-51页 |
4.2.2 Lucene优点 | 第51页 |
4.2.3 文本检索模型 | 第51-52页 |
4.3 微信文章数据的获取 | 第52-53页 |
4.3.1 网页内容提取 | 第53页 |
4.4 基于Lucene的微信文章检索实现 | 第53-56页 |
4.4.1 扩展Lucene语言分析接口 | 第53-54页 |
4.4.2 检索系统的实现 | 第54-56页 |
4.5 小结 | 第56-59页 |
第五章 自动问答系统的设计与实现 | 第59-71页 |
5.1 引言 | 第59页 |
5.2 答案抽取算法 | 第59-60页 |
5.3 句子相似度的计算 | 第60-62页 |
5.3.1 基于向量空间模型的句子相似度算法 | 第60页 |
5.3.2 基于句子结构的句子相似度算法 | 第60-61页 |
5.3.3 基于语义的句子相似度算法 | 第61-62页 |
5.4 基于句法依存的答案抽取 | 第62-66页 |
5.4.1 依存文法 | 第62-66页 |
5.5 问答系统的实现 | 第66-70页 |
5.5.1 系统实现的流程与结果 | 第66-70页 |
5.6 小结 | 第70-71页 |
第六章 总结和展望 | 第71-73页 |
6.1 总结 | 第71-72页 |
6.2 展望 | 第72-73页 |
参考文献 | 第73-77页 |
致谢 | 第77页 |