摘要 | 第4-5页 |
Abstract | 第5-6页 |
第一章 绪论 | 第11-17页 |
1.1 研究背景与意义 | 第11-12页 |
1.2 国内外研究现状 | 第12-14页 |
1.3 本文研究内容 | 第14-15页 |
1.4 本文结构 | 第15-17页 |
第二章 经典字符串相似性连接算法 | 第17-37页 |
2.1 检测相似性连接的度量方法 | 第17-23页 |
2.2 字符串领域的相似性连接算法 | 第23-29页 |
2.3 GFSF算法相关定义和描述 | 第29-33页 |
2.4 需要重新设计字符串相似性连接算法的必要性 | 第33-34页 |
2.5 设计新的字符串相似性连接算法考虑因素 | 第34-35页 |
2.6 本章小结 | 第35-37页 |
第三章 基于动态索引和虚拟多重字符过滤的分布式算法 | 第37-49页 |
3.1 基本思想 | 第37-39页 |
3.2 动态索引 | 第39-40页 |
3.3 VMC虚拟多重字符过滤 | 第40-44页 |
3.4 分布式集群设计 | 第44-46页 |
3.5 本章小结 | 第46-49页 |
第四章 实验设计与结果 | 第49-57页 |
4.1 实验环境设置 | 第49-50页 |
4.2 数据集规模对实验的影响 | 第50-52页 |
4.3 编辑距离阈值对实验的影响 | 第52-53页 |
4.4 分布式集群部署对实验的影响 | 第53-55页 |
4.5 本章小结 | 第55-57页 |
第五章 总结与展望 | 第57-59页 |
5.1 总结 | 第57页 |
5.2 后续工作 | 第57-59页 |
参考文献 | 第59-63页 |
致谢 | 第63-64页 |