首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--各种电子数字计算机论文

面向复杂距离度量的MapReduce相似性连接技术研究

摘要第5-7页
Abstract第7-8页
第1章 引言第11-19页
    1.1 研究背景第11-14页
        1.1.1 相似性连接第11-12页
        1.1.2 基于复杂距离的相似性度量第12-13页
        1.1.3 大规模数据的分布式并行处理第13-14页
    1.2 问题提出第14-16页
        1.2.1 基于复杂距离度量的大规模数据相似性连接的特点第14-15页
        1.2.2 研究现状第15-16页
    1.3 本文贡献第16-17页
    1.4 组织结构第17-19页
第2章 相关工作第19-33页
    2.1 复杂距离相似性度量第19-21页
        2.1.1 EMD距离第19-20页
        2.1.2 Bregman Divergence度量第20-21页
    2.2 索引与数据划分第21-25页
        2.2.1 面向EMD距离的索引第22-23页
        2.2.2 面向Bregman Divergence的索引第23-25页
    2.3 MapReduce计算框架与Hadoop系统第25-27页
    2.4 MapReduce计算框架下的相似性连接技术第27-31页
        2.4.1 利用二维空间网格划分数据第27-28页
        2.4.2 利用Voronoi图划分数据第28-29页
        2.4.3 利用Z-value空间填充曲线划分数据第29-31页
    2.5 本章小结第31-33页
第3章 基于EMD距离的Top-k相似性连接算法第33-55页
    3.1 协同过滤框架第33-36页
        3.1.1 B~+树过滤第34-35页
        3.1.2 LB_(IM)过滤第35-36页
        3.1.3 三角不等性过滤第36页
    3.2 基于块嵌套循环进行数据划分的基本算法第36-42页
        3.2.1 抽样确定Top-k相似性连接初始阈值第38-39页
        3.2.2 查找局部S_(Topk)第39-42页
    3.3 基于数据局部性进行数据划分的改进算法第42-49页
        3.3.1 抽样确定近似分位数和T值第44-45页
        3.3.2 利用数据局部性查找局部S_(Topk)第45-49页
    3.4 实验结果及分析第49-53页
    3.5 本章小结第53-55页
第4章 基于Bregman Divergence度量的相似性连接算法第55-77页
    4.1 基于块嵌套循环进行数据划分的基本算法第55-57页
    4.2 基于VA-File进行数据划分的改进算法第57-68页
        4.2.1 构建VA-File索引第58-59页
        4.2.2 制定负载均衡策略第59-66页
        4.2.3 实现相似性连接第66-68页
    4.3 实验结果及分析第68-74页
    4.4 本章小结第74-77页
第5章 总结与展望第77-79页
    5.1 本文的主要贡献与结论第77-78页
    5.2 未来工作第78-79页
参考文献第79-83页
致谢第83-85页
攻读硕士学位期间的论文项目情况第85页

论文共85页,点击 下载论文
上一篇:基于碳纳米材料的电流型葡萄糖传感器的构建和性能研究
下一篇:二氧化钛纳米管的表面修饰及其在电化学传感中的应用研究