网页排重技术研究及应用
第一章 引言 | 第1-16页 |
·网页查重技术研究的目的和意义 | 第8-9页 |
·网页查重算法的起源和现状 | 第9-13页 |
·本文的贡献 | 第13-14页 |
·本文的组织 | 第14-16页 |
第二章 查重技术研究 | 第16-24页 |
·程序复制检测技术的发展 | 第16页 |
·自然语言文本复制检测技术的发展 | 第16-18页 |
·自然语言文本复制检测中的几个问题 | 第18-23页 |
·程序复制检测和自然语言文本复制检测技术的关系 | 第23-24页 |
第三章 现有的网页查重算法及介绍 | 第24-42页 |
·国外常用的网页查重算法介绍 | 第24-35页 |
·国内常用的网页查重算法介绍 | 第35-39页 |
·国内外各种方法的优缺点 | 第39-42页 |
第四章 基于字频的特征串查重算法 | 第42-51页 |
·基于字频的特征串查重算法描述 | 第42-43页 |
·基于字频的特征串查重算法的优点 | 第43-44页 |
·时间复杂度和空间复杂度分析 | 第44页 |
·几种网页查重算法的性能比较试验 | 第44-51页 |
第五章 基于词频的倒排表快速网页查重算法 | 第51-64页 |
·相似性查重描述 | 第51页 |
·网页相似性查重 | 第51-53页 |
·快速相似性查重算法描述 | 第53-54页 |
·算法复杂度分析 | 第54-55页 |
·测试结果 | 第55-57页 |
·算法实际应用 | 第57-62页 |
·结论 | 第62-64页 |
第六章 结束语 | 第64-65页 |
·本文工作总结 | 第64页 |
·下一步研究方向 | 第64-65页 |
参考文献 | 第65-68页 |
致谢 | 第68-70页 |
作者简历 | 第70页 |