首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

网页查重算法研究

摘要第1-5页
Abstract第5-9页
第1章 绪论第9-14页
   ·研究的现状和背景第9-13页
     ·搜索引擎原理概述第9-10页
     ·搜索引擎的现状和不足第10-11页
     ·搜索引擎的发展趋势第11-13页
   ·研究的目的和意义第13-14页
第2章 网页查重算法概述第14-29页
   ·网页查重算法起源第14-16页
   ·网页查重算法分类第16-29页
     ·同源网页查重第16-18页
     ·基于聚类的网页查重第18-19页
     ·基于特征码的网页查重第19-23页
     ·基于关键词的网页查重第23-27页
     ·基于全文分段匹配的算法和其他算法第27-29页
第3章 网页查重算法shingling研究第29-34页
   ·shingling算法概述第29-31页
   ·shingling算法分析第31-32页
   ·shingling算法应用第32-34页
第4章 网页查重算法simhash研究第34-37页
   ·simhash算法概述第34页
   ·simhash算法的应用和评价第34-37页
第5章 搜索引擎系统的设计和实现第37-57页
   ·全文检索系统 CLUCENE第37-42页
     ·CLUCENE简介及下载安装第37-40页
     ·CLUCENE主要类第40-41页
     ·CLUCENE数据格式第41-42页
   ·系统结构分析第42-43页
   ·搜索系统的实现第43-57页
     ·索引第43-51页
     ·搜索第51-54页
     ·分析第54-57页
第6章 工作总结第57-58页
参考文献第58-61页
致谢第61-62页
附录第62页

论文共62页,点击 下载论文
上一篇:局域网计算化学网格的构建与应用研究
下一篇:基于GridSphere的网格门户关键技术研究与应用