Top-k相似字符串查询算法研究

摘要	第5-6页
Abstract	第6页
第1章绪论	第9-15页
1.1 研究背景及目的	第9-10页
1.2 研究现状	第10-12页
1.2.1 基于阈值的相似字符串查询	第10-11页
1.2.2 top-k相似字符串查询	第11-12页
1.2.3 相似字符串连接	第12页
1.3 研究内容	第12-13页
1.4 本文结构	第13-15页
第2章基础知识概述	第15-23页
2.1 编辑距离	第15-16页
2.2 问题定义	第16-17页
2.3 特征方案	第17-21页
2.3.1 处理框架	第17-19页
2.3.2 前缀过滤	第19-20页
2.3.3 对称特征方案	第20-21页
2.3.4 非对称特征方案	第21页
2.4 倒排索引	第21-22页
2.5 本章小结	第22-23页
第3章 TopkLength算法	第23-32页
3.0 基于q-gram和q-chunk的非对称特征方案	第23-25页
3.1 倒排表重复处理问题	第25-26页
3.2 基于长度跳跃索引的长度过滤策略	第26-27页
3.3 无匹配特征的字符串处理策略	第27-28页
3.4 TopkLength算法	第28-31页
3.4.1 算法思想	第28页
3.4.3 算法描述	第28-31页
3.5 本章小结	第31-32页
第4章 TopkLengthCount算法	第32-44页
4.1 问题分析	第32页
4.2 TopkLengthCount算法	第32-43页
4.2.1 自适应计数过滤策略	第32-37页
4.2.2 无匹配特征字符串处理改进策略	第37页
4.2.3 编辑距离计算的改进	第37-41页
4.2.4 算法基本思想	第41页
4.2.5 算法描述	第41-43页
4.3 本章小结	第43-44页
第5章实验结果及分析	第44-54页
5.1 实验环境和说明	第44页
5.2 数据集和评价标准	第44-46页
5.3 性能比较及分析	第46-51页
5.3.1 q值的选取	第46-48页
5.3.2 过滤效果对比	第48-49页
5.3.3 查询效果对比	第49-51页
5.4 扩展性	第51-53页
5.5 本章小结	第53-54页
结论	第54-55页
参考文献	第55-58页
攻读硕士学位期间承担的科研任务与主要成果	第58-59页
致谢	第59-60页
作者简介	第60页