首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于编辑距离字符串Top-k相似性搜索算法的研究

摘要第4-5页
ABSTRACT第5-6页
第1章 绪论第9-18页
    1.1 研究背景及目的和意义第9-10页
    1.2 字符串相似性查询的类型和度量标准第10-13页
    1.3 国内外研究现状第13-16页
        1.3.1 编辑距离研究现状第13-14页
        1.3.2 阈值查询研究现状第14页
        1.3.3 Top-k查询研究现状第14-15页
        1.3.4 相似性连接研究现状第15-16页
    1.4 本文的研究内容第16-17页
    1.5 论文组织结构第17-18页
第2章 字符串相似性搜索理论基础第18-38页
    2.1 引言第18页
    2.2 基本概念第18-23页
        2.2.1 字符串定义第18页
        2.2.2 n - g r a m定 义第18页
        2.2.3 编辑距离定义第18-22页
        2.2.4 字符串相似性搜索问题形式化定义第22-23页
    2.3 字符串过滤策略第23-24页
    2.4 现有算法介绍第24-37页
        2.4.1 AQ算法第25-26页
        2.4.2 AppGram算法第26-30页
        2.4.3 Bed-tree算法第30-31页
        2.4.4 Range算法第31-34页
        2.4.5 Hstopk算法第34-37页
    2.5 本章小结第37-38页
第3章 索引结构及搜索策略第38-59页
    3.1 引言第38-39页
    3.2 索引结构设计及构建方法第39-47页
        3.2.1 朴素索引构建方法第42-45页
        3.2.2 改进索引构建方法第45-47页
    3.3 搜索策略第47-55页
        3.3.1 顺序搜索策略第47-51页
        3.3.2 循环搜索策略第51-55页
    3.4 磁盘索引构建算法第55-58页
    3.5 本章小结第58-59页
第4章 堆初始化策略第59-71页
    4.1 引言第59页
    4.2 频率过滤第59-62页
    4.3 堆初始化整体框架第62页
    4.4 组合字符和区间划分第62-66页
    4.5 字符串集合分类第66-68页
    4.6 堆初始化算法第68-70页
    4.7 本章小结第70-71页
第5章 实验结果第71-87页
    5.1 引言第71-73页
    5.2 各算法需要内存空间大小对比第73-75页
    5.3 与其他算法对比实验第75-78页
    5.4 索引构建方法对比第78-79页
    5.5 搜索策略对比第79-80页
    5.6 堆初始化策略对比第80-82页
    5.7 磁盘算法性能测试第82-83页
    5.8 过滤性能第83-86页
    5.9 本章小结第86-87页
结论第87-89页
参考文献第89-94页
致谢第94-95页

论文共95页,点击 下载论文
上一篇:基于图方法的命名实体消歧研究
下一篇:面向智慧家庭的CPS资源协调服务技术及系统