首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

全文检索中索引算法的优化研究

摘要第3-4页
ABSTRACT第4页
1 绪论第8-12页
    1.1 研究背景第8页
    1.2 研究意义第8-9页
    1.3 国内外研究现状第9-10页
    1.4 论文主要工作第10-11页
    1.5 论文结构第11-12页
2 全文检索技术简介第12-23页
    2.1 信息检索第12页
    2.2 全文数据库和全文检索第12-13页
    2.3 文档存储第13-17页
        2.3.1 使用数据库系统第13页
        2.3.2 随机存取第13-14页
        2.3.3 压缩和大规模文件第14-15页
        2.3.4 BigTable第15-17页
    2.4 分词技术第17-19页
        2.4.1 基于词典的分词方法第17-19页
        2.4.2 基于统计的分词方法第19页
    2.5 检索模型第19-21页
        2.5.1 布尔模型第19-20页
        2.5.2 向量空间模型第20-21页
        2.5.3 概率模型第21页
    2.6 全文索引组织第21-22页
        2.6.1 正排索引第21-22页
        2.6.2 倒排索引第22页
    2.7 本章小结第22-23页
3 全文检索系统的构建第23-38页
    3.1 全文检索结构第23页
    3.2 分词处理第23-25页
    3.3 索引创建第25-27页
        3.3.1 主索引第25-26页
        3.3.2 段索引第26页
        3.3.3 删除索引第26-27页
        3.3.4 词典库第27页
    3.4 倒排索引工作流程第27-28页
    3.5 倒排索引初始构建过程第28-29页
    3.6 倒排索引的存储第29-31页
        3.6.1 倒排索引的压缩第29页
        3.6.2 倒排索引存储第29-31页
    3.7 倒排索引的更新第31-33页
    3.8 倒排索引的删除第33-35页
    3.9 倒排索引的查询第35-37页
    3.10 本章小结第37-38页
4 全文检索索引的优化第38-46页
    4.1 B-树概念第38-39页
    4.2 传统的 B-树索引第39页
    4.3 速度优化第39-41页
    4.4 实验结果分析第41页
    4.5 空间优化第41-42页
    4.6 堆栈更新第42-43页
    4.7 追加填充更新第43-44页
    4.8 增量编码第44-45页
    4.9 本章小结第45-46页
5 系统实现第46-53页
    5.1 B-树倒序索引的基本应用第46-47页
    5.2 索引的具体建立第47-50页
    5.3 索引的动态添加第50-52页
    5.4 索引的删除第52页
    5.5 词典的载入第52页
    5.6 本章小结第52-53页
6 测试与结果第53-57页
    6.1 测试环境第53页
    6.2 测试准备第53页
    6.3 测试方法第53-54页
        6.3.1 索引建立方法第53-54页
        6.3.2 搜索检验方法第54页
    6.4 测试结果第54-56页
        6.4.1 测试一第54-55页
        6.4.2 测试二第55-56页
    6.5 本章小结第56-57页
7 总结与展望第57-58页
    7.1 论文工作总结第57页
    7.2 下一步工作展望第57-58页
致谢第58-59页
参考文献第59-61页
附录第61页
    作者在攻读学位期间发表的论文目录第61页

论文共61页,点击 下载论文
上一篇:转型期我国公民参与政策议程创建的现状及受阻原因分析
下一篇:基于SQL Server的心音数据库管理系统设计