首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

支持编辑距离的高效近似字符串匹配方法

摘要第5-7页
ABSTRACT第7-8页
第1章 绪论第13-33页
    1.1 研究背景及意义第14-15页
    1.2 背景知识及相关概念第15-24页
        1.2.1 字符串相似性判定第15-18页
        1.2.2 字符串索引方法第18-24页
    1.3 相关工作及研究成果综述第24-31页
        1.3.1 近似字符串匹配问题分类第24-25页
        1.3.2 近似字符串匹配技术分类第25-28页
        1.3.3 近似字符串匹配系统分类第28-29页
        1.3.4 高相似性生物序列匹配方法分类第29-31页
    1.4 论文的主要创新和组织结构第31-33页
        1.4.1 本文的主要创新第31-32页
        1.4.2 本文的组织结构第32-33页
第2章 自适应的字符串相似性匹配方法第33-51页
    2.1 问题背景第33-34页
    2.2 问题定义第34-35页
    2.3 字符串相似性匹配方法第35-39页
        2.3.1 基本的字符串相似性匹配方法第35-37页
        2.3.2 基于最优划分策略的改进方法第37-39页
    2.4 自适应的查询方法第39-43页
        2.4.1 两种方法的理论分析第39-40页
        2.4.2 策略选择方法第40-41页
        2.4.3 自适应的字符串相似性匹配算法第41-43页
    2.5 在字符串集合上的近似查询方法第43-46页
        2.5.1 基于字符串集合的BWT索引方法第43-44页
        2.5.2 基于字符串集合的近似搜索方法第44-46页
    2.6 实验测试与分析第46-49页
        2.6.1 实验设置第46-47页
        2.6.2 评价划分策略第47-48页
        2.6.3 评价自适应方法第48页
        2.6.4 同现有方法对比第48-49页
    2.7 本章小结第49-51页
第3章 字符串局部相似性连接方法第51-79页
    3.1 问题背景第51-53页
    3.2 问题定义第53-54页
    3.3 基于匹配gram的局部相似性连接框架第54-56页
    3.4 局部相似性验证方法第56-61页
        3.4.1 基于匹配gram的验证方法第56-57页
        3.4.2 优化技术第57-61页
    3.5 局部相似性过滤方法第61-68页
        3.5.1 局部计数过滤第61-63页
        3.5.2 减少对连续匹配的gram对的验证第63-64页
        3.5.3 增量局部计数过滤第64-68页
    3.6 定位局部相似对第68-70页
        3.6.1 定位技术第68-69页
        3.6.2 采用增量窗口长度的局部计数过滤第69-70页
    3.7 实验测试与分析第70-77页
        3.7.1 实验设置第70-71页
        3.7.2 整体性能第71-72页
        3.7.3 评价候选集构建方法第72-75页
        3.7.4 评价验证方法第75-76页
        3.7.5 可伸缩性第76页
        3.7.6 评价索引大小第76-77页
        3.7.7 同修改的Pass-Join比较第77页
    3.8 本章小结第77-79页
第4章 多核并行的近似字符串匹配方法第79-101页
    4.1 问题背景第79-80页
    4.2 问题定义第80页
    4.3 多核架构查询框架第80-83页
    4.4 基于BWT索引的并行近似字符串匹配方法第83-89页
        4.4.1 支持计算共享的划分与重组方法第83-84页
        4.4.2 基于反向查询子树的查询方法第84-86页
        4.4.3 局部最优的扩展验证方法第86-89页
    4.5 有限内存空间下的并行匹配方法第89-93页
        4.5.1 采用重叠分片的BWT索引方法第89-91页
        4.5.2 采用不相交分片的BWT索引方法第91-93页
    4.6 实验测试与分析第93-98页
        4.6.1 实验设置第93-94页
        4.6.2 评价划分重组方法以及验证方法第94-95页
        4.6.3 评价并行策略第95-96页
        4.6.4 同现有方法对比第96-97页
        4.6.5 评价分片索引方法第97-98页
    4.7 本章小结第98-101页
第5章 面向压缩生物数据的高效匹配方法第101-121页
    5.1 问题背景第101-102页
    5.2 问题定义第102-103页
    5.3 基于压缩生物数据的基本查询方法第103-104页
    5.4 基于压缩生物数据的改进查询方法第104-107页
        5.4.1 减少验证次数第105-106页
        5.4.2 减少索引大小第106-107页
    5.5 基于压缩生物数据的分布式索引方法第107-115页
        5.5.1 基本的分布式索引方法第107-108页
        5.5.2 改进的分布式索引方法第108-111页
        5.5.3 基于分布式索引的查询方法第111-115页
    5.6 实验测试与分析第115-119页
        5.6.1 实验设置第115页
        5.6.2 评价索引开销第115-116页
        5.6.3 评价并行索引开销第116-117页
        5.6.4 评价并行方法查询效率第117-118页
        5.6.5 评价可伸缩性第118-119页
    5.7 本章小结第119-121页
第6章 结束语第121-123页
    6.1 本文工作总结第121-122页
    6.2 未来的研究方向第122-123页
参考文献第123-131页
致谢第131-133页
攻博期间发表的论文第133-135页
攻博期间参与的项目第135-137页
作者简介第137页

论文共137页,点击 下载论文
上一篇:概率XML数据中关键字检索算法研究
下一篇:面向先进空间应用的复杂查询技术研究