首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于网络爬虫技术的多源下载系统的设计与实现

摘要第1-5页
ABSTRACT第5-9页
第一章 引言第9-15页
   ·选题背景及意义第9-10页
   ·研究现状第10-13页
     ·搜索引擎现状第10页
     ·javascript在网页中的嵌入方式第10-11页
     ·javascript解析的研究现状第11-12页
     ·网络下载技术的研究现状第12-13页
   ·本文工作及章节安排第13-14页
   ·本章小结第14-15页
第二章 相关技术第15-27页
   ·网络爬虫技术第15-20页
     ·网络爬虫的基本原理及工作流程第15页
     ·网页抓取策略第15-17页
     ·网络爬虫分类第17-19页
     ·网络爬虫技术的进展第19-20页
   ·超文本传输协议HTTP第20-24页
     ·统一资源定位符URL第21页
     ·HTTP报文结构第21-23页
     ·HTTP协议的内部操作过程第23-24页
   ·多线程机制第24-25页
     ·线程的创建第24-25页
     ·线程的常用方法第25页
   ·本章小结第25-27页
第三章 基于网络爬虫技术的多源下载系统的设计第27-37页
   ·总体架构设计第27-28页
   ·系统流程设计第28-30页
   ·关键技术第30-35页
     ·Rhino解析引擎的功能和特点第30-31页
     ·Rhino解析引擎分析第31-34页
     ·Rhino解析引擎的改进第34-35页
   ·本章小结第35-37页
第四章 基于网络爬虫技术的多源下载系统的实现第37-51页
   ·搜索模块的实现第37-42页
     ·搜索模块的基本思想第37页
     ·搜索模块的实现第37-42页
   ·存储和展示模块的实现第42-46页
     ·分组存储和展示的必要性第43页
     ·存储展示模块的基本思想第43-44页
     ·分组规则第44页
     ·存储和展示模块的实现第44-46页
   ·下载模块的实现第46-50页
     ·下载模块的基本思想第46-47页
     ·计算文件的MD5值第47-48页
     ·下载模块的实现第48-50页
   ·本章小结第50-51页
第五章 测试和实验结果分析第51-54页
   ·软件系统的测试第51-52页
   ·实验结果第52-53页
   ·结论第53-54页
第六章 总结与展望第54-56页
   ·课题总结第54-55页
   ·未来工作展望第55-56页
参考文献第56-58页
致谢第58-59页
作者攻读学位期间发表的学术论文目录第59页

论文共59页,点击 下载论文
上一篇:基于工作流的医疗体检系统的设计与实现
下一篇:基于Clucene的个人数据检索支撑系统的设计与实现