首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

分布式Web Crawler系统研究与实现

摘要第1-5页
ABSTRACT第5-10页
第一章 绪论第10-14页
   ·引言第10页
   ·国内外的研究现状第10-12页
   ·论文的目的和意义第12页
   ·论文的内容与组织结构第12-14页
第二章 搜索引擎相关理论第14-21页
   ·搜索引擎简介第14-15页
   ·搜索引擎的发展历史第15-16页
   ·搜索引擎的主要需求第16-17页
   ·搜索引擎的系统组成第17-20页
     ·Web 信息的搜集第18-19页
     ·对搜索信息的预处理第19-20页
     ·信息查询服务第20页
   ·本章小结第20-21页
第三章 爬虫系统基本原理第21-29页
   ·超文本传输协议第21-23页
   ·爬虫系统雏形第23-25页
   ·通信信道的建立第25-26页
   ·发送请求和接受数据第26-27页
   ·解析HTML第27-28页
   ·本章小结第28-29页
第四章 分布式 Web Crawler 核心技术第29-43页
   ·网页抓取优先策略第29-32页
     ·深度优先策略第29-31页
     ·广度优先策略第31-32页
     ·最佳优先策略第32页
   ·万维网的直径第32-33页
   ·网页重要性判定第33-34页
   ·不重复抓取策略第34-38页
     ·基于B-树的算法第34-35页
     ·基于哈希的算法第35-38页
   ·网页重访策略第38-41页
   ·Robots 协议第41-42页
   ·本章小结第42-43页
第五章 分布式 Web Crawler 系统设计第43-55页
   ·分布式 Web Crawler 系统结构设计第43-44页
   ·Web Crawler 抓取基本流程设计第44-45页
   ·分布式 Web Crawler 合作抓取算法设计第45-46页
   ·系统分布式实现策略第46-52页
     ·系统分布式体系结构第46-48页
     ·系统分布式实现过程第48-50页
     ·系统回调实现第50-52页
   ·大规模网页存储结构设计第52-54页
     ·传统网页存储结构第52页
     ·改进后的网页存储结构第52-54页
   ·本章小结第54-55页
第六章 分布式 Web Crawler 系统实现第55-71页
   ·系统主要功能模块第55-62页
     ·网页静态分析模块第55-57页
     ·网页抓取模块第57-59页
     ·分布式RMI 模块第59-61页
     ·URL 动态分配模块第61-62页
   ·系统运行界面第62-67页
     ·添加种子站点第62页
     ·开启爬虫服务器和客户端第62-65页
     ·开始抓取任务第65-66页
     ·抓取结果第66-67页
   ·系统评价第67-70页
     ·系统运行环境第67-68页
     ·性能评价第68-69页
     ·可扩展性评价第69页
     ·任务负载均衡评价第69-70页
   ·本章小结第70-71页
第七章 总结与展望第71-72页
   ·本文所做的工作第71页
   ·进一步的工作和展望第71-72页
参考文献第72-74页
致谢第74-75页
个人简历、在学期间发表的学术论文与研究成果第75页

论文共75页,点击 下载论文
上一篇:结合人类视觉特性的小波域图像数字水印算法研究
下一篇:基于教学反馈模型的远程教育平台的研究与实现