首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Groovy的分布式网络爬虫系统的设计与实现

摘要第1-7页
Abstract第7-11页
第1章 绪论第11-15页
   ·研究背景与意义第11页
   ·国内外研究现状第11-13页
   ·本论文研究内容及章节安排第13-15页
     ·研究内容第13-14页
     ·章节安排第14-15页
第2章 相关技术基础第15-20页
   ·网络爬虫系统简介第15页
   ·主题页面分布特征第15-16页
   ·HTTP通信协议第16-18页
     ·HTTP协议简介第16-17页
     ·HTTP请求方式第17页
     ·HTTP响应状态第17-18页
   ·脚本语言介绍第18-19页
   ·本章小结第19-20页
第3章 网络爬虫系统CTCS的需求分析第20-24页
   ·项目概述第20页
   ·系统目标及功能需求第20-22页
     ·系统目标第20页
     ·系统功能需求第20-22页
   ·运行环境需求第22-24页
     ·系统运行平台需求第22-23页
     ·系统运行环境分析第23-24页
第4章 网络爬虫系统CTCS的设计第24-42页
   ·系统结构设计第24-26页
     ·系统体系结构第24-25页
     ·系统拓扑结构第25-26页
   ·各子系统的模块划分与设计第26-34页
     ·爬虫终端子系统第26-29页
     ·调度中心子系统第29-30页
     ·数据中心子系统第30-32页
     ·日志及监控子系统第32-34页
   ·各子系统内部工作流程第34-40页
     ·爬虫终端子系统工作流程第35-36页
     ·调度中心子系统工作流程第36-38页
     ·数据中心子系统工作流程第38-39页
     ·日志及监控子系统工作流程第39-40页
   ·各子系统间通信接口设计第40-41页
   ·本章小结第41-42页
第5章 网络爬虫系统CTCS的详细设计与实现第42-68页
   ·开发平台与工具第42-43页
   ·爬虫终端子系统的实现第43-53页
     ·HTTP通信模块的实现第43-49页
     ·HTML解析模块的实现第49页
     ·Groovy脚本驱动模块的实现第49-50页
     ·多线程控制模块的实现第50页
     ·XML构造解析模块的实现第50-51页
     ·内部通信模块的实现第51-52页
     ·系统日志模块的实现第52-53页
   ·调度中心子系统的实现第53-65页
     ·配置信息管理模块第53页
     ·RMI交互模块第53-64页
     ·任务负载平衡管理模块第64-65页
     ·爬虫终端进程管理模块第65页
     ·运行状态管理模块第65页
   ·日志及监控子系统的实现第65-67页
     ·日志Web接口模块的实现第65-66页
     ·日志报告生成模块的实现第66页
     ·预警监测模块的实现第66-67页
     ·邮件处理模块的实现第67页
   ·本章小结第67-68页
第6章 系统运行及效果第68-76页
   ·系统运行环境第68页
   ·系统运行效果第68-76页
     ·调度中心子系统的运行效果第69-72页
     ·爬虫终端子系统的运行效果第72-73页
     ·数据中心子系统的运行效果第73-74页
     ·日志及监控子系统的运行效果第74-76页
总结与展望第76-78页
 总结第76页
 工作展望第76-78页
致谢第78-79页
参考文献第79-83页
攻读硕士学位期间发表的论文及科研成果第83页

论文共83页,点击 下载论文
上一篇:外籍教师管理信息系统的设计与实现
下一篇:敏捷软件开发方法在学习辅助管理系统中的应用研究