首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

相似网页识别算法的研究与实现

摘要第1-5页
ABSTRACT第5-8页
第一章 绪论第8-15页
   ·课题背景第8-10页
   ·课题意义第10-11页
   ·国内外研究现状第11-13页
   ·论文的主要工作第13-14页
     ·论文的研究内容第13页
     ·论文的结构第13-14页
   ·本章小结第14-15页
第二章 相似网页识别算法的相关研究第15-30页
   ·相似网页识别的基本流程第15-16页
   ·相似网页识别算法的分类第16页
   ·相似网页识别的相关算法第16-28页
     ·DSC和DSC-SS算法第16-17页
     ·I-Match算法第17-19页
     ·基于全文分段匹配的相似网页识别算法第19页
     ·基于向量空间模型的相似网页识别算法第19-21页
     ·基于特征串的相似网页识别算法第21-22页
     ·Simhash相似网页识别算法第22-23页
     ·基于Web链接结构的相似网页识别算法第23-25页
     ·SIF第25-27页
     ·SCAM第27-28页
   ·算法比较第28-29页
   ·本章小结第29-30页
第三章 相似网页识别算法的改进第30-36页
   ·算法改进的指导原则第30-31页
   ·改进算法的设计第31-34页
     ·基于DSC算法的特征串提取第31-32页
     ·基于Simhash算法的指纹生成第32页
     ·单词序列权重的计算第32-33页
     ·单词序列的选择第33-34页
   ·本章小结第34-36页
第四章 测试系统的实现及实验分析第36-56页
   ·工具选择第36页
   ·测试系统的架构第36-37页
     ·架构简图第36-37页
   ·功能模块的实现第37-45页
     ·DownLoader模块第37-39页
     ·Cleanupper模块第39页
     ·Analyzer模块第39-40页
     ·SimAdvancer模块第40-45页
   ·数据的存储第45-46页
     ·数据库表设计第45-46页
   ·指纹匹配运算第46-48页
   ·实验及结论第48-54页
     ·指纹哈希函数的选择第48-50页
     ·改进算法的相关实验第50-54页
   ·本章小结第54-56页
第五章 总结与展望第56-58页
致谢第58-59页
参考文献第59-62页
研究生阶段发表论文目录第62页

论文共62页,点击 下载论文
上一篇:面向对象的IPv4/IPv6分布式网络监测系统
下一篇:基于Smith-waterman的应用层协议特征自动提取算法的研究与实现