首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

Top-k字符串相似连接算法性能优化研究

摘要第5-7页
ABSTRACT第7页
第1章 绪论第12-19页
    1.1 字符串相似连接处理及其应用第12-13页
    1.2 基于阈值的字符串相似连接算法第13-16页
        1.2.1 ALLPairs算法第13-15页
        1.2.2 PPJoin算法和PPJoinplus算法第15-16页
    1.3 Top-k相似连接算法第16-17页
    1.4 本文的主要研究内容及贡献第17-18页
    1.5 章节组织第18-19页
第2章 问题的定义和背景知识第19-26页
    2.1 问题定义第19-21页
    2.2 相似连接函数内在属性第21-23页
    2.3 过滤技术第23-25页
        2.3.1 前缀过滤(Prefix Filtering)第23-24页
        2.3.2 长度过滤(Size Filtering)第24页
        2.3.3 位置过滤(Positional Filtering)第24页
        2.3.4 后缀过滤(Suffix Filtering)第24-25页
    2.4 本章小结第25-26页
第3章 Top-k相似连接算法的实现第26-36页
    3.1 Top-k相似连接算法概述第26-27页
    3.2 临时结果和事件第27-28页
    3.3 Top-k相似连接实现第28-31页
        3.3.1 Top-k相似连接算法第28-30页
        3.3.2 验证(Verification)算法第30-31页
    3.4 Top-k相似连接索引优化第31-35页
        3.4.1 索引优化第31-33页
        3.4.2 索引进一步优化第33-35页
    3.5 本章小结第35-36页
第4章 Top-k相似连接算法优化第36-51页
    4.1 哈希优化第36-39页
        4.1.1 哈希查找的性能问题及解决方法第36-38页
        4.1.2 正确性证明第38-39页
    4.2 后缀过滤优化第39-45页
        4.2.1 后缀过滤上界值第39页
        4.2.2 后缀过滤下界值第39-40页
        4.2.3 后缀过滤算法第40-41页
        4.2.4 后缀过滤优化第41-45页
    4.3 前缀批处理优化第45-50页
        4.3.1 事件驱动框架存在的问题第45页
        4.3.2 MultiLen的选取第45-48页
        4.3.3 OPTJoin相似连接算法第48-50页
    4.4 本章小结第50-51页
第5章 实验结果和分析第51-59页
    5.1 实验数据及处理第51-52页
        5.1.1 实验数据第51页
        5.1.2 数据预处理第51-52页
    5.2 实验结果分析第52-58页
        5.2.1 全局哈希表代价对比第52-53页
        5.2.2 候选对过滤能力第53-55页
        5.2.3 前缀事件个数第55页
        5.2.4 验证候选对数量对比第55-56页
        5.2.5 程序运行时间第56-58页
    5.3 本章小结第58-59页
第6章 结论第59-60页
    6.1 本文总结第59页
    6.2 工作展望第59-60页
参考文献第60-64页
攻读硕士学位期间发表的学术论文第64-65页
致谢第65页

论文共65页,点击 下载论文
上一篇:SiewertⅡ/Ⅲ型食管胃结合部腺癌经腹开放与腹腔镜根治性全胃切除术近期疗效临床研究
下一篇:影响乳腺癌患者选择乳房重建相关因素分析