| 摘要 | 第1-6页 |
| Abstract | 第6-11页 |
| 第1章 绪论 | 第11-18页 |
| ·课题背景及研究的目的和意义 | 第11-12页 |
| ·课题背景 | 第11页 |
| ·研究的目的和意义 | 第11-12页 |
| ·国内外研究现状 | 第12-15页 |
| ·分段算法的研究现状 | 第12-13页 |
| ·段落检索策略的研究现状 | 第13-14页 |
| ·段落相似度计算的研究现状 | 第14页 |
| ·基于段落检索的自动问答研究现状 | 第14-15页 |
| ·本课题的主要研究内容 | 第15-16页 |
| ·本文结构的安排 | 第16-18页 |
| 第2章 检索相关段落的算法 | 第18-33页 |
| ·引言 | 第18页 |
| ·基于窗口的固定长度分段算法 | 第18-21页 |
| ·与四种分段算法的比较 | 第18-19页 |
| ·基于窗口的重叠分段与不重叠分段的算法描述 | 第19-21页 |
| ·重叠分段与不重叠分段的比较 | 第21页 |
| ·段落检索策略 | 第21-24页 |
| ·四种段落检索策略的比较 | 第21-23页 |
| ·采取的段落检索策略 | 第23-24页 |
| ·输入段落的表示——有序关键词序列 | 第24-29页 |
| ·将大粒度输入表示为可搜索的形式 | 第24页 |
| ·输入预处理中的关键词提取 | 第24-25页 |
| ·关键词提取算法 | 第25页 |
| ·关键词权重的计算方法 | 第25-26页 |
| ·关键词提取算法准确率的实验与分析 | 第26-29页 |
| ·基于关键词交集的搜索算法 | 第29-31页 |
| ·算法流程 | 第29-30页 |
| ·关键词交集搜索时间的实验与分析 | 第30-31页 |
| ·本章小结 | 第31-33页 |
| 第3章 段落相似度计算与评测 | 第33-48页 |
| ·引言 | 第33页 |
| ·段落相似度计算的相关算法简述 | 第33-35页 |
| ·基于词频统计的MITRE算法 | 第33-34页 |
| ·基于查询词密度的算法 | 第34-35页 |
| ·基于语言模型的模糊关系匹配算法 | 第35页 |
| ·SITEQ算法 | 第35-38页 |
| ·SiteQ算法详解 | 第35-36页 |
| ·SiteQ算法与其他段落相似度计算算法的比较 | 第36-37页 |
| ·SiteQ算法举例 | 第37-38页 |
| ·SITEQ算法的改进 | 第38-41页 |
| ·正排索引时记录标题和段落正文的位置信息 | 第38-39页 |
| ·SiteQ算法的改进 | 第39-40页 |
| ·改进后SiteQ算法的举例说明 | 第40-41页 |
| ·段落检索系统的实验与分析 | 第41-47页 |
| ·评估段落检索系统的方法 | 第41-42页 |
| ·实验数据的来源与准备 | 第42-43页 |
| ·SiteQ算法与MITRE算法的对比实验 | 第43-44页 |
| ·SiteQ-Title算法与SiteQ算法的对比实验 | 第44-46页 |
| ·段落检索系统的实验与分析 | 第46-47页 |
| ·本章小结 | 第47-48页 |
| 第4章 段落检索系统在自动问答的应用 | 第48-54页 |
| ·引言 | 第48页 |
| ·海天园自动问答系统现状 | 第48-49页 |
| ·系统现状 | 第48-49页 |
| ·不足之处 | 第49页 |
| ·段落检索在自动问答上的应用研究 | 第49-53页 |
| ·同义词扩展 | 第50-51页 |
| ·问题类型识别 | 第51页 |
| ·答案抽取 | 第51-53页 |
| ·本章小结 | 第53-54页 |
| 第5章 段落检索系统的实现、演示及后续研究 | 第54-65页 |
| ·引言 | 第54页 |
| ·网页爬虫、净化与索引 | 第54-56页 |
| ·网页爬虫 | 第54-55页 |
| ·净化与索引 | 第55-56页 |
| ·段落文件的存储 | 第56-57页 |
| ·分词及索引建立 | 第57-59页 |
| ·分词 | 第57-58页 |
| ·倒排索引 | 第58页 |
| ·正排索引 | 第58-59页 |
| ·段落检索系统演示 | 第59-62页 |
| ·输入界面演示 | 第59-60页 |
| ·结果界面演示 | 第60-62页 |
| ·自动问答系统演示 | 第62-63页 |
| ·后续研究 | 第63-64页 |
| ·论文抄袭检测的应用 | 第63页 |
| ·段落检索方面的后续研究 | 第63-64页 |
| ·基于段落检索的自动问答的后续研究 | 第64页 |
| ·本章小结 | 第64-65页 |
| 结论 | 第65-66页 |
| 参考文献 | 第66-73页 |
| 致谢 | 第73页 |