首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

网络爬虫系统的研究与实现

摘要第1-6页
ABSTRACT第6-7页
目录第7-10页
第1章 概述第10-15页
   ·引言第10-11页
   ·网络爬虫的研究背景与意义第11-12页
   ·网络爬虫国内外研究现状第12-13页
   ·研究内容第13页
     ·本课题解决的关键问题第13页
     ·本文的主要研究内容第13页
   ·论文章节安排第13-15页
第2章 相关技术介绍第15-28页
   ·网络爬虫简介第15-17页
     ·Spider 的概念第15页
     ·网络爬虫原理第15-16页
     ·网络爬虫搜索策略第16-17页
   ·C#线程第17-21页
     ·线程概述第17-18页
     ·C#线程模型第18页
     ·创建线程第18-19页
     ·C#中的线程的生命周期第19-20页
     ·多线程同步第20页
     ·URL 消重第20-21页
       ·URL 消重的意义第20页
       ·网络爬虫 URL 去重储存库设计第20-21页
       ·基于磁盘的顺序存储第21页
   ·URL 类访问网络第21-22页
   ·爬行策略浅析第22-26页
     ·宽度或深度优先搜索策略第22页
     ·聚焦搜索策略第22-23页
     ·基于内容评价的搜索策略第23页
     ·基于链接结构评价的搜索策略第23-25页
     ·基于巩固学习的聚焦搜索第25页
     ·基于语境图的聚焦搜索第25-26页
   ·正则表达式第26-27页
     ·正则表达式应用分析第26页
     ·正则表达式的元字符分析第26-27页
   ·本章小结第27-28页
第3章 系统需求分析及模块设计第28-31页
   ·系统需求分析第28页
   ·SPIDER 体系结构第28-29页
   ·主要功能模块(类)的设计第29-30页
   ·SPIDER 工作过程第30页
   ·本章小结第30-31页
第4章 系统分析与设计第31-37页
   ·SPIDER 构造分析第31-32页
   ·爬行策略分析第32-34页
     ·多线程爬虫模型分析第33页
     ·爬虫集群模型分析第33-34页
   ·URL 抽取,解析和保存第34-36页
     ·URL 抽取第34-35页
     ·URL 解析第35页
     ·URL 保存第35-36页
   ·本章小结第36-37页
第5章 系统实现第37-50页
   ·实现工具第37页
   ·MYSQL 数据库的实现第37-38页
   ·URL 解析第38-39页
   ·URL 队列管理第39页
     ·URL 消重处理第39页
     ·URL 等待队列维护第39页
   ·SOCKET Create()函数的设计与实现第39-41页
   ·CCONNECT( )函数的设计与实现第41-43页
   ·CCLOSE( )函数模块的设计与实现第43-44页
   ·CSEND( )函数模块的设计与实现第44-45页
   ·CRECV( )函数模块的设计与实现第45-46页
   ·主要类的实现第46-49页
   ·本章小结第49-50页
第6章 系统测试第50-59页
   ·系统性能测试理论基础第50-51页
   ·详细测试过程第51-54页
   ·研究成果第54-59页
第7章 结论第59-61页
致谢第61-62页
参考文献第62-64页

论文共64页,点击 下载论文
上一篇:基于客户关系管理的辽河油田信息系统设计与实现
下一篇:川职院OA系统的设计与实现