基于随机算法的分布式实体匹配技术
摘要 | 第6-8页 |
Abstract | 第8-10页 |
第一章 绪论 | 第13-26页 |
1.1 研究背景 | 第13-17页 |
1.2 研究内容与主要工作 | 第17-22页 |
1.2.1 基于随机算法的快速实体匹配方案 | 第19-20页 |
1.2.2 基于随机算法的分布式实现框架 | 第20-22页 |
1.2.3 分布式冗余计算去除方案 | 第22页 |
1.3 本文贡献 | 第22-25页 |
1.3.1 基于随机算法的快速实体匹配方案 | 第23页 |
1.3.2 基于随机算法的分布式实现框架 | 第23-24页 |
1.3.3 分布式冗余计算去除方案 | 第24-25页 |
1.4 本文结构 | 第25-26页 |
第二章 相关工作 | 第26-33页 |
2.1 文档实体匹配技术 | 第26-27页 |
2.2 分块策略 | 第27-29页 |
2.3 MapReduce分布式框架 | 第29-30页 |
2.4 分布式实体匹配技术 | 第30-33页 |
第三章 基于随机算法的实体匹配 | 第33-44页 |
3.1 问题定义 | 第33-38页 |
3.2 快速实体匹配方案实现 | 第38-41页 |
3.3 实验结果 | 第41-44页 |
3.3.1 实验环境与数据集 | 第41页 |
3.3.2 位置敏感哈希函数的正确性验证 | 第41-44页 |
第四章 基于随机算法的分布式实体匹配框架 | 第44-54页 |
4.1 基于分布式的实体匹配方案研究 | 第44-45页 |
4.2 分布式实体匹配框架 | 第45-49页 |
4.2.1 框架总览 | 第45-48页 |
4.2.2 框架分析 | 第48-49页 |
4.3 实验对比 | 第49-54页 |
4.3.1 实验环境与数据集介绍 | 第49页 |
4.3.2 参数选择测试与分析 | 第49-54页 |
第五章 分布式冗余计算问题与去除方案 | 第54-65页 |
5.1 分布式冗余计算问题成因 | 第54-55页 |
5.2 冗余去除 | 第55-60页 |
5.2.1 基于分组的冗余去除 | 第56-58页 |
5.2.2 基于校验的冗余去除方案 | 第58-60页 |
5.3 实验分析 | 第60-63页 |
5.3.1 基于分组策略结果 | 第61页 |
5.3.2 基于校验策略结果 | 第61-63页 |
5.4 本章小结 | 第63-65页 |
第六章 总结与展望 | 第65-67页 |
参考文献 | 第67-74页 |
致谢 | 第74-77页 |
攻读硕士学位期间发表论文和科研情况 | 第77-78页 |