首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于海明距离的相似查找索引算法研究

致谢第5-6页
摘要第6-7页
ABSTRACT第7页
1 引言第10-14页
    1.1 研究背景与意义第10-11页
    1.2 研究现状第11-12页
    1.3 研究内容第12-13页
    1.4 论文的组织结构第13-14页
2 相似查找及其相关技术第14-23页
    2.1 相似查找及相似词典查询问题第14-15页
    2.2 相似性计算与距离度量第15-18页
        2.2.1 相似性计算方法第15-16页
        2.2.2 距离度量第16-18页
    2.3 基于Simhash的近似文本检测第18-22页
        2.3.1 Simhash介绍第18-19页
        2.3.2 基于Simhash的近似文本检测流程第19-21页
        2.3.3 本文Simhash方法使用第21-22页
    2.4 本章小结第22-23页
3 基于海明空间的多索引Search算法第23-36页
    3.1 静态海明距离的相似查找问题描述第23-24页
    3.2 静态海明距离的相似查找算法研究第24-26页
    3.3 基于海明空间的多索引算法第26-30页
        3.3.1 多索引算法主要研究内容第26-28页
        3.3.2 Manku的多索引Search算法第28-30页
    3.4 基于海明空间的多索引Search算法第30-34页
        3.4.1 算法基本思想第31页
        3.4.2 索引结构设计第31-33页
        3.4.3 参数k与b对候选集数目的影响第33-34页
    3.5 本章小结第34-36页
4 基于中心点的Check算法第36-43页
    4.1 基于中心点的Check算法基本思想和索引结构第36-38页
        4.1.1 基于中心点的Check算法基本思想第36-38页
        4.1.2 索引结构设计第38页
    4.2 基于中心点的一般Check算法第38-39页
    4.3 基于中心点的贪心Check算法第39-42页
        4.3.1 贪心策略第40-41页
        4.3.2 参数及临界条件分析第41-42页
    4.4 本章小结第42-43页
5 实验与分析第43-56页
    5.1 评价标准第43-44页
    5.2 实验条件第44-45页
        5.2.1 实验数据集第44页
        5.2.2 实验环境和工具第44-45页
    5.3 实验预处理和实验过程第45-47页
        5.3.1 实验的预处理第45-46页
        5.3.2 实验过程第46-47页
    5.4 多索引Search算法实验与分析第47-51页
        5.4.1 平均候选集数目对比实验与分析第48-50页
        5.4.2 平均查询时间对比实验与分析第50-51页
    5.5 基于中心点的Check算法实验与分析第51-55页
        5.5.1 平均查询时间对比实验与分析第52-53页
        5.5.2 平均检查的候选集数目对比实验与分析第53-55页
    5.6 本章小结第55-56页
6 总结与展望第56-58页
    6.1 工作总结第56-57页
    6.2 未来展望第57-58页
参考文献第58-62页
作者简历及攻读硕士学位期间取得的研究成果第62-64页
学位论文数据集第64页

论文共64页,点击 下载论文
上一篇:基于Word2Vec的中文短文本聚类算法研究与应用
下一篇:多层球模型与非球模型下EEG、MEG正问题数值模拟