首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

大数据处理中的容错技术研究

摘要第3-4页
Abstract第4-5页
第1章 绪论第10-19页
    1.1 选题背景和意义第10-16页
        1.1.1 近似抽取第12-13页
        1.1.2 近似连接第13-14页
        1.1.3 近似检索第14-15页
        1.1.4 大规模数据处理框架第15-16页
    1.2 主要研究内容和贡献第16-18页
    1.3 章节安排第18-19页
第2章 支持多相似性函数的近似抽取统一框架第19-49页
    2.1 引言第19-20页
    2.2 统一的框架第20-24页
        2.2.1 问题定义第20-21页
        2.2.2 统一框架第21-22页
        2.2.3 有效子字符串第22-24页
    2.3 基于堆的过滤算法第24-30页
        2.3.1 倒排索引第24-25页
        2.3.2 基于多堆的方法第25-27页
        2.3.3 基于单堆的方法第27-30页
    2.4 改进基于单堆的算法第30-40页
        2.4.1 剪枝技术第30-34页
        2.4.2 快速地找到候选窗口第34-40页
    2.5 Faerie算法第40-42页
        2.5.1 正确性和完备性第41-42页
    2.6 实验第42-46页
        2.6.1 比较基于多堆的方法和基于单堆的方法第43页
        2.6.2 剪枝技术的有效性第43-44页
        2.6.3 与现有的最好的方法的比较第44-45页
        2.6.4 字典大小的可扩展性第45-46页
    2.7 相关工作第46-48页
    2.8 本章小结第48-49页
第3章 基于序列相似性的近似连接方法第49-89页
    3.1 引言第49页
    3.2 预备知识第49-51页
        3.2.1 问题定义第49-50页
        3.2.2 相关工作第50-51页
    3.3 基于划分的框架第51-56页
        3.3.1 划分方法第51-52页
        3.3.2 基于划分的框架第52-56页
    3.4 优化子字符串选取第56-69页
        3.4.1 位置敏感的子字符串选取方法第58-61页
        3.4.2 多段匹配敏感的子字符串选取第61-66页
        3.4.3 子字符串选取方法的比较第66-68页
        3.4.4 子字符串选取算法第68-69页
    3.5 提高验证效率第69-75页
        3.5.1 长度敏感的验证方法第69-72页
        3.5.2 基于扩展的验证第72-74页
        3.5.3 共享计算第74-75页
        3.5.4 验证算法第75页
    3.6 进一步讨论第75-81页
        3.6.1 支持Edit Similarity第75-77页
        3.6.2 支持异连接第77-78页
        3.6.3 MapReduce下的基于划分的方法第78-81页
    3.7 实验第81-88页
        3.7.1 评估子字符串选取方法第81-83页
        3.7.2 评估验证方法第83-84页
        3.7.3 与现有最好方法的比较第84-85页
        3.7.4 可扩展性第85-86页
        3.7.5 评估在MapReduce下的性能第86-88页
    3.8 本章小结第88-89页
第4章 基于集合相似性的近似连接方法第89-119页
    4.1 引言第89-90页
    4.2 预备知识第90-92页
        4.2.1 问题定义第90页
        4.2.2 基于前缀过滤的方法第90-91页
        4.2.3 相关工作第91-92页
    4.3 基于划分的框架第92-98页
        4.3.1 集合划分第92-94页
        4.3.2 基于划分的方法第94-98页
    4.4 片段选择第98-104页
        4.4.1 1-删集第98-102页
        4.4.2 最优分配选择第102-104页
    4.5 加速分配策略选取第104-109页
        4.5.1 分配策略选择第105-108页
        4.5.2 多长度分组机制第108-109页
    4.6 进一步讨论第109-112页
        4.6.1 支持其他近似函数第109-110页
        4.6.2 支持异连接第110页
        4.6.3 支持MapReduce和Spark框架第110-112页
    4.7 实验第112-117页
        4.7.1 评估分配选择算法第112-114页
        4.7.2 评估多长度分组机制第114-115页
        4.7.3 与现有的方法比较第115-116页
        4.7.4 可扩展性第116页
        4.7.5 评估异连接第116-117页
        4.7.6 评估算法在Spark下的性能第117页
    4.8 本章小结第117-119页
第5章 基于关键前缀过滤的近似检索方法第119-146页
    5.1 引言第119-120页
    5.2 预备知识第120-122页
        5.2.1 问题定义第120页
        5.2.2 基于q-gram的过滤技术第120-121页
        5.2.3 相关工作第121-122页
    5.3 关键前缀过滤第122-128页
        5.3.1 关键前缀过滤第123-126页
        5.3.2 与现有最好方法的比较第126-128页
    5.4 基于关键前缀的过滤算法第128-131页
    5.5 关键q-gram选取第131-135页
        5.5.1 关键前缀的存在性第131-132页
        5.5.2 评估不同的关键前缀第132-133页
        5.5.3 关键前缀选取算法第133-135页
    5.6 在关键q-gram上的对齐过滤第135-139页
        5.6.1 转换过程中的对齐第136-138页
        5.6.2 对齐过滤第138页
        5.6.3 验证算法第138-139页
    5.7 支持动态阈值第139-141页
    5.8 实验第141-145页
        5.8.1 评估关键前缀过滤技术第142-143页
        5.8.2 评估对齐过滤第143-144页
        5.8.3 与现有最好方法的比较第144-145页
        5.8.4 可扩展性第145页
    5.9 本章小结第145-146页
第6章 总结与展望第146-148页
    6.1 本文工作总结第146-147页
    6.2 未来工作展望第147-148页
参考文献第148-153页
致谢第153-155页
个人简历、在学期间发表的学术论文与研究成果第155-157页

论文共157页,点击 下载论文
上一篇:典型土壤中多环芳烃的赋存形态及影响因素初探
下一篇:不同柳树与内生微生物互作净化富营养化水体效应研究