摘要 | 第4-5页 |
Abstract | 第5页 |
第一章 绪论 | 第8-14页 |
1.1 课题研究的背景和意义 | 第8-9页 |
1.1.1 课题研究的背景 | 第8-9页 |
1.1.2 课题研究的意义 | 第9页 |
1.2 研究现状 | 第9-12页 |
1.2.1 问答系统的平台现状 | 第9-10页 |
1.2.2 社区知识库的研究现状 | 第10-11页 |
1.2.3 文本检索排序技术的研究现状 | 第11-12页 |
1.3 研究内容 | 第12页 |
1.4 本文组织结构 | 第12-14页 |
第二章 相关技术理论概述 | 第14-26页 |
2.1 爬虫采集技术 | 第14-16页 |
2.2 数据预处理技术 | 第16-18页 |
2.2.1 中文分词技术 | 第16-17页 |
2.2.2 word2vec | 第17-18页 |
2.3 短文本分类技术 | 第18-21页 |
2.4 检索排序技术 | 第21-25页 |
2.4.1 问题检索 | 第21-23页 |
2.4.2 相似度排序 | 第23-25页 |
2.5 本章小结 | 第25-26页 |
第三章 基于多元非文本属性特征中文社区知识库构建与优化 | 第26-35页 |
3.1 中文社区问答数据特点及局限性 | 第26-27页 |
3.2 社区多元非文本属性特征 | 第27页 |
3.3 基于多元属性特征构建并优化知识库 | 第27-32页 |
3.3.1 数据集的选择 | 第28页 |
3.3.2 爬虫采集构建知识库 | 第28-31页 |
3.3.3 社区知识库优化 | 第31-32页 |
3.4 实验验证 | 第32-34页 |
3.4.1 知识库问题的回答正确性 | 第32-34页 |
3.4.2 优化影响因子 | 第34页 |
3.5 本章小结 | 第34-35页 |
第四章 基于可信评价的检索排序优化模型 | 第35-46页 |
4.1 数据预处理模块 | 第35-36页 |
4.1.1 中文分词 | 第35-36页 |
4.1.2 文本表示 | 第36页 |
4.2 问题短文本层次分类模块 | 第36-39页 |
4.3 基于可信评价检索模型在健康医疗社区数据检索中的应用 | 第39-41页 |
4.3.1 索引模块 | 第39-40页 |
4.3.2 可信评价检索排序优化方案 | 第40-41页 |
4.4 实验验证 | 第41-45页 |
4.4.1 检索排序优化算法对比 | 第42-44页 |
4.4.2 优化影响因子 | 第44-45页 |
4.5 本章小结 | 第45-46页 |
第五章 系统设计实现与评测 | 第46-54页 |
5.1 系统设计与架构 | 第46-49页 |
5.1.1 系统总体设计架构 | 第46-47页 |
5.1.2 系统功能模块设计 | 第47-49页 |
5.2 系统展示 | 第49-51页 |
5.2.1 系统Web终端页面展示 | 第49-50页 |
5.2.2 系统移动终端App界面展示 | 第50-51页 |
5.3 系统测试及分析 | 第51-53页 |
5.3.1 系统性能评价指标 | 第51-52页 |
5.3.2 系统用户评价指标 | 第52页 |
5.3.3 系统结果分析 | 第52-53页 |
5.4 本章小结 | 第53-54页 |
第六章 总结与展望 | 第54-56页 |
6.1 总结 | 第54-55页 |
6.2 展望 | 第55-56页 |
参考文献 | 第56-58页 |
附录1 攻读硕士学位期间撰写的论文 | 第58-59页 |
附录2 攻读硕士学位期间参加的科研项目 | 第59-60页 |
致谢 | 第60页 |