首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

主题网络爬虫的分析与设计

摘要第1-6页
ABSTRACT第6-10页
第一章 引言第10-16页
   ·概述第10-11页
   ·国内外研究现状第11-14页
     ·通用网络爬虫研究现状第11-12页
     ·主题网络爬虫研究现状第12-14页
   ·论文主要工作第14-16页
第二章 搜索引擎中的网络爬虫第16-28页
   ·搜索引擎的介绍第16-21页
     ·搜索引擎的发展历史第16-17页
     ·搜索引擎的分类第17-20页
     ·搜索引擎的工作原理第20-21页
   ·网络爬虫的结构第21-26页
     ·通用网络爬虫结构体系第21-24页
     ·主题网络爬虫体系结构第24-26页
   ·本章小结第26-28页
第三章 对主题网络爬虫关键技术的分析第28-44页
   ·主题网络爬虫的搜索策略第28-30页
   ·基于内容的搜索策略第30-32页
     ·Fish-Search算法第31-32页
     ·Shark-Search算法和相关度计算第32页
   ·基于链接的搜索策略第32-35页
     ·PageRank算法第33-35页
   ·两种算法的比较第35页
   ·各种策略的对比以及隧道现象第35-43页
     ·各种策略的对比分析第35-36页
     ·隧道现象第36-37页
     ·基于隧道现象的Fish-Search算法改进第37-39页
     ·改进的Shark-Search算法第39-43页
   ·本章小结第43-44页
第四章 主题网络爬虫的系统设计第44-63页
   ·开发工具第44-46页
     ·Heritrjx第44-45页
     ·Eclipse第45-46页
   ·系统的主要模块设计第46-61页
     ·系统功能模块组成第46-48页
     ·系统主要的工作流程第48-49页
     ·种子集合的选择第49-50页
     ·Socket连接和Http协议分析第50-52页
     ·HTML协议分析第52-57页
     ·中文分词算法第57-58页
     ·页面消重分析和SCAM算法第58-61页
   ·存储设计第61-62页
   ·本章小结第62-63页
第五章 实验分析第63-66页
   ·实验环境第63页
   ·数据性能评价指标第63-64页
   ·实验结果与分析第64-66页
第六章 总结与展望第66-67页
   ·论文工作总结第66页
   ·问题与展望第66-67页
参考文献第67-70页
致谢第70页

论文共70页,点击 下载论文
上一篇:文本数字水印技术的研究
下一篇:英语例句垂直搜索引擎的研究与实现