首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

搜索引擎中的索引压缩和查询问题研究

摘要第9-11页
Abstract第11-12页
第一章 绪论第13-25页
    1.1 研究背景第13-18页
        1.1.1 搜索引擎面临的性能挑战第13-16页
        1.1.2 如何提升搜索引擎的性能第16-18页
        1.1.3 研究意义第18页
    1.2 搜索引擎性能研究第18-23页
        1.2.1 系统性能评价指标第18-20页
        1.2.2 倒排索引压缩和查询的关系第20-23页
    1.3 本文主要研究工作第23-24页
    1.4 论文组织结构第24-25页
第二章 倒排索引基本理论第25-39页
    2.1 倒排索引组织结构第25-29页
        2.1.1 倒排索引数据组成第25-27页
        2.1.2 倒排项的排列方式第27-29页
    2.2 倒排索引压缩算法第29-33页
        2.2.1 比特对齐压缩第30-31页
        2.2.2 字节对齐压缩第31页
        2.2.3 32/64 位字对齐压缩第31-33页
    2.3 倒排索引查询算法第33-38页
        2.3.1 穷尽遍历算法第33-35页
        2.3.2 动态剪枝算法第35-36页
        2.3.3 经典动态剪枝算法实例第36-38页
    2.4 本章小结第38-39页
第三章 分组密集Simple9压缩算法第39-65页
    3.1 引言第39-41页
    3.2 密集Simple9压缩算法第41-46页
        3.2.1 数据存储格式第41-42页
        3.2.2 压缩算法描述第42-43页
        3.2.3 解压算法描述第43-46页
    3.3 分组Simple9压缩算法第46-55页
        3.3.1 数据存储格式第47-51页
        3.3.2 压缩算法描述第51-53页
        3.3.3 解压算法描述第53-55页
    3.4 实验测试与结果分析第55-62页
        3.4.1 实验设置和测试数据第55-56页
        3.4.2 密集Simple9压缩测试第56-58页
        3.4.3 分组Simple9压缩测试第58-62页
    3.5 本章小结第62-65页
第四章 基于必要表跳跃访问的Max Score查询算法第65-87页
    4.1 引言第65-66页
    4.2 加快倒排链表的访问速度第66-72页
        4.2.1 自索引结构的作用第66-68页
        4.2.2 多层自索引结构设计第68-69页
        4.2.3 倒排链表对象及其方法第69-72页
    4.3 ELS-Max Score查询算法第72-79页
        4.3.1 自索引结构下的AND过滤第72-74页
        4.3.2 Max Score算法存在的问题第74-77页
        4.3.3 ELS-Max Score查询算法第77-79页
    4.4 实验测试与结果分析第79-85页
        4.4.1 自索引结构对动态剪枝算法的影响第80-81页
        4.4.2 ELS-Max Score查询性能测试第81-83页
        4.4.3 返回结果个数k对查询性能的影响第83-85页
    4.5 本章小结第85-87页
第五章 最大重要度优先查询算法第87-109页
    5.1 引言第87-88页
    5.2 词项重要度对查询的影响第88-93页
        5.2.1 WAND算法存在的问题第89-90页
        5.2.2 激进式Max Score算法第90-92页
        5.2.3 词项重要度影响候选文档的选择第92-93页
    5.3 最大重要度优先查询算法第93-101页
        5.3.1 LSF穷尽索引遍历算法第93-94页
        5.3.2 基于LSF的动态剪枝算法第94-97页
        5.3.3 算法描述和分析第97-101页
    5.4 实验测试与结果分析第101-108页
        5.4.1 LSF穷尽遍历算法性能测试第102-104页
        5.4.2 基于LSF的动态剪枝算法性能测试第104-106页
        5.4.3 考虑各种因素的扩展性能测试第106-108页
    5.5 本章小结第108-109页
第六章 总结与展望第109-113页
    6.1 本文工作总结第109-110页
    6.2 未来研究展望第110-113页
致谢第113-115页
参考文献第115-124页
作者在学期间取得的学术成果第124页

论文共124页,点击 下载论文
上一篇:基于B/S架构的IDC机房3D监控管理系统的设计与实现
下一篇:基于云存储环境的数据完整性研究