摘要 | 第1-6页 |
Abstract | 第6-11页 |
第1章 绪论 | 第11-18页 |
·课题背景及研究的目的和意义 | 第11-12页 |
·课题背景 | 第11页 |
·研究的目的和意义 | 第11-12页 |
·国内外研究现状 | 第12-15页 |
·分段算法的研究现状 | 第12-13页 |
·段落检索策略的研究现状 | 第13-14页 |
·段落相似度计算的研究现状 | 第14页 |
·基于段落检索的自动问答研究现状 | 第14-15页 |
·本课题的主要研究内容 | 第15-16页 |
·本文结构的安排 | 第16-18页 |
第2章 检索相关段落的算法 | 第18-33页 |
·引言 | 第18页 |
·基于窗口的固定长度分段算法 | 第18-21页 |
·与四种分段算法的比较 | 第18-19页 |
·基于窗口的重叠分段与不重叠分段的算法描述 | 第19-21页 |
·重叠分段与不重叠分段的比较 | 第21页 |
·段落检索策略 | 第21-24页 |
·四种段落检索策略的比较 | 第21-23页 |
·采取的段落检索策略 | 第23-24页 |
·输入段落的表示——有序关键词序列 | 第24-29页 |
·将大粒度输入表示为可搜索的形式 | 第24页 |
·输入预处理中的关键词提取 | 第24-25页 |
·关键词提取算法 | 第25页 |
·关键词权重的计算方法 | 第25-26页 |
·关键词提取算法准确率的实验与分析 | 第26-29页 |
·基于关键词交集的搜索算法 | 第29-31页 |
·算法流程 | 第29-30页 |
·关键词交集搜索时间的实验与分析 | 第30-31页 |
·本章小结 | 第31-33页 |
第3章 段落相似度计算与评测 | 第33-48页 |
·引言 | 第33页 |
·段落相似度计算的相关算法简述 | 第33-35页 |
·基于词频统计的MITRE算法 | 第33-34页 |
·基于查询词密度的算法 | 第34-35页 |
·基于语言模型的模糊关系匹配算法 | 第35页 |
·SITEQ算法 | 第35-38页 |
·SiteQ算法详解 | 第35-36页 |
·SiteQ算法与其他段落相似度计算算法的比较 | 第36-37页 |
·SiteQ算法举例 | 第37-38页 |
·SITEQ算法的改进 | 第38-41页 |
·正排索引时记录标题和段落正文的位置信息 | 第38-39页 |
·SiteQ算法的改进 | 第39-40页 |
·改进后SiteQ算法的举例说明 | 第40-41页 |
·段落检索系统的实验与分析 | 第41-47页 |
·评估段落检索系统的方法 | 第41-42页 |
·实验数据的来源与准备 | 第42-43页 |
·SiteQ算法与MITRE算法的对比实验 | 第43-44页 |
·SiteQ-Title算法与SiteQ算法的对比实验 | 第44-46页 |
·段落检索系统的实验与分析 | 第46-47页 |
·本章小结 | 第47-48页 |
第4章 段落检索系统在自动问答的应用 | 第48-54页 |
·引言 | 第48页 |
·海天园自动问答系统现状 | 第48-49页 |
·系统现状 | 第48-49页 |
·不足之处 | 第49页 |
·段落检索在自动问答上的应用研究 | 第49-53页 |
·同义词扩展 | 第50-51页 |
·问题类型识别 | 第51页 |
·答案抽取 | 第51-53页 |
·本章小结 | 第53-54页 |
第5章 段落检索系统的实现、演示及后续研究 | 第54-65页 |
·引言 | 第54页 |
·网页爬虫、净化与索引 | 第54-56页 |
·网页爬虫 | 第54-55页 |
·净化与索引 | 第55-56页 |
·段落文件的存储 | 第56-57页 |
·分词及索引建立 | 第57-59页 |
·分词 | 第57-58页 |
·倒排索引 | 第58页 |
·正排索引 | 第58-59页 |
·段落检索系统演示 | 第59-62页 |
·输入界面演示 | 第59-60页 |
·结果界面演示 | 第60-62页 |
·自动问答系统演示 | 第62-63页 |
·后续研究 | 第63-64页 |
·论文抄袭检测的应用 | 第63页 |
·段落检索方面的后续研究 | 第63-64页 |
·基于段落检索的自动问答的后续研究 | 第64页 |
·本章小结 | 第64-65页 |
结论 | 第65-66页 |
参考文献 | 第66-73页 |
致谢 | 第73页 |