首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Web文档理解的倒排全文索引研究与实现

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-14页
   ·本论文的研究背景和意义第9页
   ·国内外研究现状第9-12页
     ·全文索引国内外研究现状第9-11页
     ·倒排索引的国内外研究现状第11页
     ·Web 文档理解的研究现状第11-12页
   ·本论文的研究内容第12-13页
   ·论文结构第13-14页
第二章 倒排全文索引的基础理论和方法第14-23页
   ·全文索引概述第14-17页
     ·全文索引与全文检索第14-15页
     ·全文索引文件的概念结构第15-17页
     ·全文索引优劣的评价标准第17页
   ·倒排索引技术第17-18页
   ·倒排文件及其性能模型第18-19页
   ·倒排索引的压缩第19-21页
     ·游程编码和整数差压缩索引策略第19-20页
     ·混合编码的压缩方案第20-21页
   ·倒排文件缓存机制第21-22页
   ·本章小结第22-23页
第三章 Web 文档理解方法的研究第23-35页
   ·PageRank 技术理解网页重要性第23-25页
     ·PageRank 的概念和计算公式第23-24页
     ·PageRank 工作原理第24-25页
   ·通过分词技术和向量空间模型理解 Web 文档意义第25-29页
     ·自动分词系统的理论模型第25-26页
     ·自动分词算法研究第26-27页
     ·向量空间模型第27-29页
   ·利用潜在语义分析深度理解 Web 文档第29-34页
     ·潜在语义索引的基本思想第29-30页
     ·奇异值的分解第30-32页
     ·潜在语义索引的数学依据第32-33页
     ·潜在语义索引中相似关系的计算第33-34页
   ·本章小结第34-35页
第四章 Web 文档理解方法指导下的倒排索引构建第35-52页
   ·倒排索引文件结构改进第35-39页
     ·相关倒排索引文件第35-37页
     ·实验结果及其分析第37-39页
   ·倒排索引的创建过程研究第39-42页
   ·倒排索引的动态更新第42-48页
   ·检索结果相似度计算的研究及改进第48-50页
     ·检索结果相似度计算第48-49页
     ·相似度计算公式的改进第49-50页
     ·实验结果及其分析第50页
   ·利用相关倒排索引文件进行检索第50-51页
   ·本章小结第51-52页
第五章 基于 Web 文档理解的倒排索引系统的设计与实现第52-64页
   ·Lucene 的索引模块实现机制第52-53页
   ·索引系统的总体结构设计第53-55页
     ·主题搜索引擎系统模型第53页
     ·基于Web 文档理解的倒排索引系统总体模块设计第53-54页
     ·索引系统的源文件格式设计第54-55页
   ·自动分词模块第55-57页
   ·语义分析模块设计第57-58页
   ·索引模块的设计与实现第58-61页
     ·索引创建功能第58-59页
     ·索引更新功能第59-61页
   ·相关检索模块的设计与实现第61-63页
   ·本章小结第63-64页
第六章 总结与展望第64-66页
   ·论文主要工作总结第64页
   ·进一步工作展望第64-66页
参考文献第66-69页
致谢第69-70页
个人简历、在学期间发表的学术论文与研究成果第70页

论文共70页,点击 下载论文
上一篇:基于用户兴趣的个性化信息检索分析与研究
下一篇:一种基于熵量守恒的改进演化算法的研究