基于编辑距离的字符串相似连接的研究
摘要 | 第1-5页 |
Abstract | 第5-8页 |
第1章 绪论 | 第8-16页 |
·课题背景 | 第8-9页 |
·课题来源 | 第8页 |
·课题目的及意义 | 第8-9页 |
·国内外研究现状 | 第9-15页 |
·All-Pairs和Ed-Join算法 | 第9-11页 |
·Trie-Join算法 | 第11-13页 |
·Pass-Join算法 | 第13-15页 |
·本文主要研究内容 | 第15页 |
·本文组织结构 | 第15-16页 |
第2章 频率向量及数据划分 | 第16-30页 |
·预备知识与频率向量 | 第16-17页 |
·频率过滤的研究 | 第17-24页 |
·L1频率过滤 | 第17-20页 |
·斜差分距离 | 第20-24页 |
·组合字符以及频率区间的划分 | 第24-29页 |
·数据划分综述 | 第24-25页 |
·区间划分以及组合字符的选取 | 第25-29页 |
·本章小结 | 第29-30页 |
第3章 基于数据划分内存方法 | 第30-44页 |
·过滤方法及分析 | 第30-35页 |
·字符串与字符串之间的过滤 | 第30-31页 |
·数据子集与数据子集之间的过滤 | 第31-32页 |
·字符串和数据子集之间的过滤 | 第32-35页 |
·基于频率向量数据划分的算法 | 第35页 |
·实验结果及分析 | 第35-43页 |
·实验设定 | 第35-38页 |
·实验结果 | 第38-43页 |
·本章小结 | 第43-44页 |
第4章 基于数据划分外存方法 | 第44-57页 |
·算法框架 | 第44-46页 |
·调度方法 | 第46-49页 |
·外存增量式算法 | 第49-52页 |
·实验结果及分析 | 第52-56页 |
·数据划分方法的过滤效率 | 第52-53页 |
·缓存大小对IO次数的影响 | 第53-54页 |
·调度算法的性能比较 | 第54-55页 |
·外存连接算法的整体性能 | 第55-56页 |
·增量式计算的效率 | 第56页 |
·本章小结 | 第56-57页 |
结论 | 第57-58页 |
参考文献 | 第58-62页 |
攻读硕士学位期间发表的论文及其他成果 | 第62-64页 |
致谢 | 第64页 |