首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于WEB信息采集的分布式网络爬虫搜索引擎的研究

提要第1-7页
第1章 绪 论第7-9页
   ·课题背景及意义第7页
   ·本文主要工作内容第7-8页
   ·论文组织结构第8-9页
第2章 分布式网络爬虫相关知识第9-15页
   ·搜索引擎相关知识第9-13页
     ·搜索引擎基本工作原理第9-10页
     ·集中式爬虫工作方式第10-11页
     ·分布式爬虫的工作方式第11-12页
     ·分布式系统的优缺点第12-13页
   ·分布式网络爬虫研究现状第13-14页
   ·本章小结第14-15页
第3章 系统功能分析与结构设计第15-23页
   ·分布式网络爬虫的设计要求第15-16页
   ·分布式网络爬虫的几种拓扑结构第16-19页
     ·中心化拓扑结构第16-17页
     ·全分布式非结构化拓扑结构第17页
     ·半分布式拓扑结构第17-18页
     ·全分布式结构化拓扑结构第18-19页
   ·系统的基本结构设计第19-22页
     ·总体结构设计第19-20页
     ·爬行节点结构设计第20-22页
   ·控制节点结构设计第22页
   ·本章小结第22-23页
第4章 系统的任务分配模块的设计与实现第23-31页
   ·分配策略分类第23-24页
   ·动态任务分配策略具体算法第24-27页
     ·动态哈希函数应满足的条件第24-25页
     ·实现动态分配的两种算法第25-26页
     ·进一步分析二级哈希映射算法第26-27页
   ·任务分配粒度的选择第27-30页
     ·任务分配粒度的种类第27-28页
     ·站点中心词提取策略第28-30页
   ·本章小结第30-31页
第5章 系统的通信模块的设计与实现第31-42页
   ·节点间消息通信模块设计第31-38页
     ·消息协议的设计目标第31页
     ·消息种类与格式第31-32页
     ·消息所对应的系统动作第32-38页
   ·节点间 URL 传输模块设计第38-41页
     ·URL 传输方法的选择第38-39页
     ·阻塞套接字与非阻塞套接字第39-41页
   ·本章小结第41-42页
第6章 论文总结与展望第42-43页
   ·工作总结第42页
   ·进一步的工作第42-43页
参考文献第43-44页
致谢第44-45页
摘要第45-47页
ABSTRACT第47-49页

论文共49页,点击 下载论文
上一篇:电力运行调度管理系统的设计与实现
下一篇:农银汇理基金公司信息系统建设方案的研究与实现