首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

垃圾页面检测及其在垂直搜索引擎中的应用

摘要第1-6页
Abstract第6-11页
第1章 绪论第11-18页
   ·课题背景及意义第11-12页
   ·国内外的研究状况第12-16页
     ·垃圾页面的检测第13页
     ·搜索引擎页面排序算法的研究第13-15页
     ·搜索引擎的研究现状及发展趋势第15页
     ·垃圾页面检测及排序算法研究存在的问题第15-16页
   ·本文的主要研究内容第16-17页
   ·本文的组织结构第17-18页
第2章 相关技术介绍第18-26页
   ·垃圾页面的相关介绍第18-20页
     ·垃圾页面的目的第18-19页
     ·垃圾页面的类型第19页
     ·垃圾页面对搜索引擎的影响第19-20页
   ·页面排序算法的相关介绍第20-23页
     ·PageRank 算法原理第20-22页
     ·HITS 算法原理第22-23页
   ·垂直搜索引擎的相关介绍第23-25页
     ·垂直搜索引擎的产生背景第23页
     ·垂直搜索引擎的概念第23页
     ·垂直搜索引擎的技术特点第23-24页
     ·垂直搜索引擎结构第24-25页
   ·本章小结第25-26页
第3章 基于页面隐藏技术的垃圾页面检测算法第26-37页
   ·页面隐藏技术第26-27页
   ·HTML 标签树的构造第27-32页
     ·HTML 文件预处理第28-30页
     ·HTML 文件存放的数据结构第30-32页
   ·页面隐藏垃圾页面的检测算法第32-33页
   ·实验与结果分析第33-36页
     ·实验数据集第34页
     ·评价标准第34页
     ·实验结果第34-36页
   ·本章小结第36-37页
第4章 抗击链接垃圾页面的PageRank 改进算法第37-49页
   ·PageRank 算法第37-39页
     ·PageRank 算法原理第37-38页
     ·PageRank 算法的实现第38-39页
   ·垃圾页面检测与PageRank 算法改进第39-44页
     ·抗击链接农场的Truncated PageRank 算法第39-41页
     ·链接垃圾页面的检测方法第41-43页
     ·抗击链接垃圾页面的PageRank 算法第43-44页
   ·实验与结果分析第44-48页
     ·模拟数据集第44-45页
     ·实验结果分析第45-48页
   ·本章小结第48-49页
第5章 抗击垃圾页面的垂直搜索引擎设计第49-61页
   ·搜索引擎相关技术第49-52页
     ·搜索引擎的主要技术第49-51页
     ·搜索引擎的评价标准第51-52页
   ·构造垂直搜索引擎的开源工具介绍第52-55页
     ·全文检索引擎Lucene第52-53页
     ·开源搜索引擎Nutch第53-54页
     ·网络爬虫Heritrix第54-55页
   ·抗击垃圾页面的垂直搜索引擎设计第55-57页
     ·抗击垃圾页面的垂直搜索引擎体系结构第55-56页
     ·系统设计分析第56-57页
   ·抗击垃圾页面的垂直搜索引擎性能分析第57-60页
     ·页面集第57页
     ·实验环境及实验步骤第57页
     ·实验结果分析第57-60页
   ·本章小结第60-61页
结论第61-63页
参考文献第63-67页
攻读硕士学位期间承担的科研任务与主要成果第67-68页
致谢第68-69页
作者简介第69页

论文共69页,点击 下载论文
上一篇:工作流建模方法及模型验证方法的研究
下一篇:抵御多次连接探秘攻击的视图发布方法研究