首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

段落检索系统及其应用的研究

摘要第1-6页
Abstract第6-11页
第1章 绪论第11-18页
   ·课题背景及研究的目的和意义第11-12页
     ·课题背景第11页
     ·研究的目的和意义第11-12页
   ·国内外研究现状第12-15页
     ·分段算法的研究现状第12-13页
     ·段落检索策略的研究现状第13-14页
     ·段落相似度计算的研究现状第14页
     ·基于段落检索的自动问答研究现状第14-15页
   ·本课题的主要研究内容第15-16页
   ·本文结构的安排第16-18页
第2章 检索相关段落的算法第18-33页
   ·引言第18页
   ·基于窗口的固定长度分段算法第18-21页
     ·与四种分段算法的比较第18-19页
     ·基于窗口的重叠分段与不重叠分段的算法描述第19-21页
     ·重叠分段与不重叠分段的比较第21页
   ·段落检索策略第21-24页
     ·四种段落检索策略的比较第21-23页
     ·采取的段落检索策略第23-24页
   ·输入段落的表示——有序关键词序列第24-29页
     ·将大粒度输入表示为可搜索的形式第24页
     ·输入预处理中的关键词提取第24-25页
     ·关键词提取算法第25页
     ·关键词权重的计算方法第25-26页
     ·关键词提取算法准确率的实验与分析第26-29页
   ·基于关键词交集的搜索算法第29-31页
     ·算法流程第29-30页
     ·关键词交集搜索时间的实验与分析第30-31页
   ·本章小结第31-33页
第3章 段落相似度计算与评测第33-48页
   ·引言第33页
   ·段落相似度计算的相关算法简述第33-35页
     ·基于词频统计的MITRE算法第33-34页
     ·基于查询词密度的算法第34-35页
     ·基于语言模型的模糊关系匹配算法第35页
   ·SITEQ算法第35-38页
     ·SiteQ算法详解第35-36页
     ·SiteQ算法与其他段落相似度计算算法的比较第36-37页
     ·SiteQ算法举例第37-38页
   ·SITEQ算法的改进第38-41页
     ·正排索引时记录标题和段落正文的位置信息第38-39页
     ·SiteQ算法的改进第39-40页
     ·改进后SiteQ算法的举例说明第40-41页
   ·段落检索系统的实验与分析第41-47页
     ·评估段落检索系统的方法第41-42页
     ·实验数据的来源与准备第42-43页
     ·SiteQ算法与MITRE算法的对比实验第43-44页
     ·SiteQ-Title算法与SiteQ算法的对比实验第44-46页
     ·段落检索系统的实验与分析第46-47页
   ·本章小结第47-48页
第4章 段落检索系统在自动问答的应用第48-54页
   ·引言第48页
   ·海天园自动问答系统现状第48-49页
     ·系统现状第48-49页
     ·不足之处第49页
   ·段落检索在自动问答上的应用研究第49-53页
     ·同义词扩展第50-51页
     ·问题类型识别第51页
     ·答案抽取第51-53页
   ·本章小结第53-54页
第5章 段落检索系统的实现、演示及后续研究第54-65页
   ·引言第54页
   ·网页爬虫、净化与索引第54-56页
     ·网页爬虫第54-55页
     ·净化与索引第55-56页
   ·段落文件的存储第56-57页
   ·分词及索引建立第57-59页
     ·分词第57-58页
     ·倒排索引第58页
     ·正排索引第58-59页
   ·段落检索系统演示第59-62页
     ·输入界面演示第59-60页
     ·结果界面演示第60-62页
   ·自动问答系统演示第62-63页
   ·后续研究第63-64页
     ·论文抄袭检测的应用第63页
     ·段落检索方面的后续研究第63-64页
     ·基于段落检索的自动问答的后续研究第64页
   ·本章小结第64-65页
结论第65-66页
参考文献第66-73页
致谢第73页

论文共73页,点击 下载论文
上一篇:人脸识别中图像描述方法的研究
下一篇:基于时间区间的RFID复杂事件处理方法的研究