首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

Top-k相似字符串查询算法研究

摘要第5-6页
Abstract第6页
第1章 绪论第9-15页
    1.1 研究背景及目的第9-10页
    1.2 研究现状第10-12页
        1.2.1 基于阈值的相似字符串查询第10-11页
        1.2.2 top-k相似字符串查询第11-12页
        1.2.3 相似字符串连接第12页
    1.3 研究内容第12-13页
    1.4 本文结构第13-15页
第2章 基础知识概述第15-23页
    2.1 编辑距离第15-16页
    2.2 问题定义第16-17页
    2.3 特征方案第17-21页
        2.3.1 处理框架第17-19页
        2.3.2 前缀过滤第19-20页
        2.3.3 对称特征方案第20-21页
        2.3.4 非对称特征方案第21页
    2.4 倒排索引第21-22页
    2.5 本章小结第22-23页
第3章 TopkLength算法第23-32页
    3.0 基于q-gram和q-chunk的非对称特征方案第23-25页
    3.1 倒排表重复处理问题第25-26页
    3.2 基于长度跳跃索引的长度过滤策略第26-27页
    3.3 无匹配特征的字符串处理策略第27-28页
    3.4 TopkLength算法第28-31页
        3.4.1 算法思想第28页
        3.4.3 算法描述第28-31页
    3.5 本章小结第31-32页
第4章 TopkLengthCount算法第32-44页
    4.1 问题分析第32页
    4.2 TopkLengthCount算法第32-43页
        4.2.1 自适应计数过滤策略第32-37页
        4.2.2 无匹配特征字符串处理改进策略第37页
        4.2.3 编辑距离计算的改进第37-41页
        4.2.4 算法基本思想第41页
        4.2.5 算法描述第41-43页
    4.3 本章小结第43-44页
第5章 实验结果及分析第44-54页
    5.1 实验环境和说明第44页
    5.2 数据集和评价标准第44-46页
    5.3 性能比较及分析第46-51页
        5.3.1 q值的选取第46-48页
        5.3.2 过滤效果对比第48-49页
        5.3.3 查询效果对比第49-51页
    5.4 扩展性第51-53页
    5.5 本章小结第53-54页
结论第54-55页
参考文献第55-58页
攻读硕士学位期间承担的科研任务与主要成果第58-59页
致谢第59-60页
作者简介第60页

论文共60页,点击 下载论文
上一篇:基于SWRL规则的个性化语义搜索方法的研究与实现
下一篇:基于J2EE平台的网络化PDF电子文档的研究与应用