首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

支持云计算的微博在线采集方法研究与应用

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-15页
   ·课题研究目的和意义第10-11页
   ·课题的国内外研究现状第11-13页
     ·课题的国外研究现状第11-12页
     ·课题的国内研究现状第12-13页
   ·论文主要的研究内容和组织结构第13-15页
第2章 分布式计算及网络爬虫技术原理及分析第15-25页
   ·引言第15页
   ·HTTP 协议概要第15-16页
   ·网络爬虫技术原理第16-18页
     ·网络爬虫的基本原理第16-17页
     ·网络爬虫的基本结构第17-18页
   ·分布式系统概要第18-20页
     ·分布式系统的概念与原理第18页
     ·分布式系统的优点与局限性第18-19页
     ·分布式系统的结构第19-20页
   ·Hadoop 平台相关技术原里第20-24页
     ·Hadoop 文件系统 HDFS 的原理第20-22页
     ·Hadoop 文件系统 HDFS 的优点与局限性第22页
     ·分布式计算框架 MapReduce第22-24页
   ·本章小结第24-25页
第3章 分布式微博爬虫的功能分析与架构设计第25-38页
   ·引言第25页
   ·微博数据的获取方法第25-26页
     ·微博运营商提供接口获取数据第25页
     ·网络爬虫获取数据第25-26页
   ·分布式微博爬虫的架构设计第26-29页
   ·模拟浏览器登录微博的设计第29-32页
     ·HTTP 数据报文的分析第29-31页
     ·模拟浏览器登录微博的设计第31-32页
   ·分布式微博爬虫 Master/Slave 节点工作流程的设计第32-36页
     ·Master 节点任务采集工作流程的设计第32-33页
     ·Master 节点任务调度流程的设计第33-34页
     ·Slave 节点爬虫基本工作流程的设计第34-35页
     ·Slave 节点 SLM 进程工作流程的设计第35-36页
   ·云计算扩展功能的设计第36-37页
   ·本章总结第37-38页
第4章 分布式微博爬虫的具体实现第38-63页
   ·引言第38页
   ·存储结构结构的实现第38-44页
     ·Master 节点采集任务数据表第38-39页
     ·Master 节点作业映射表第39-40页
     ·Master 节点作业调度表第40-41页
     ·Slave 节点采集作业缓存第41页
     ·普通模式微博采集信息抽取表第41-43页
     ·Hadoop 扩展模式微博采集信息抽取存储结构第43-44页
   ·Master/Slave 节点基本功能模块实现第44-58页
     ·Master 节点数据库操作模块第44-45页
     ·Master 节点任务采集模块第45-47页
     ·Master 节点异常采集处理模块第47-48页
     ·Master 节点任务调度模块第48-51页
     ·Slave 节点爬虫监听模块第51-53页
     ·Slave 节点作业采集模式及爬虫采集模块第53-55页
     ·Slave 节点异常采集处理模块第55-58页
   ·分布式微博爬虫辅助日志的实现第58-59页
   ·Hadoop 扩展功能的实现第59-61页
     ·在 Hadoop 计算框架 MapReduce 上的应用第59-60页
     ·分布式微博爬虫扩展模式的实现第60-61页
   ·本章总结第61-63页
第5章 整体部署与实验测试第63-72页
   ·引言第63页
   ·实验软件和硬件环境第63-64页
   ·部署 Master 节点及相关实验测试第64-67页
     ·部署 Master 节点基本环境第64页
     ·运行并测试 Master 节点任务采集程序第64-66页
     ·运行并测试 Master 节点调度程序第66-67页
   ·部署 Slave 节点及整体实验测试分析第67-69页
     ·部署 Slave 节点及爬虫并发运行的测试第67-68页
     ·分布式爬虫数据采集测试与分析第68-69页
   ·实验测试 Hadoop 扩展功能第69-71页
     ·配置部署 Hadoop 环境第69-71页
     ·云计算扩展功能测试与分析第71页
   ·本章小结第71-72页
结论第72-74页
参考文献第74-77页
致谢第77-78页
作者简介第78页

论文共78页,点击 下载论文
上一篇:显微热成像系统的图像处理理论与技术研究
下一篇:基于周期性休眠的以太网节能策略及性能研究