首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

互联网爬行器的研究与实现

提要第1-8页
第1章 绪论第8-12页
   ·研究背景第8-10页
     ·网络资源第8-9页
     ·网络资源的现状及发展第9-10页
   ·研究的目的和意义第10页
   ·主要工作第10-11页
   ·本章小结第11-12页
第2章 搜索引擎第12-28页
   ·搜索引擎的介绍第12页
   ·发展历史第12-14页
   ·搜索引擎分类第14-15页
   ·搜索引擎的工作原理第15-19页
     ·搜索引擎的工作步骤第15-16页
     ·爬行器第16页
     ·索引器第16-17页
     ·检索器第17-18页
     ·存储器第18-19页
     ·爬行陷阱第19页
   ·Google搜索引擎第19-25页
     ·Google搜索引擎的体系结构第19-21页
     ·Google的数据库结构第21-23页
     ·网页等级值(pagerank)第23-24页
     ·Google的搜索过程第24-25页
   ·搜索引擎发展的现状以及趋势第25-26页
   ·本章小结第26-28页
第3章 爬行器的系统概述第28-30页
   ·功能概述第28页
   ·体系结构第28-29页
   ·系统环境第29页
   ·本章小结第29-30页
第4章 爬行器的总体设计第30-37页
   ·爬行器的总体设计第30-31页
     ·爬行器的工作流程第30-31页
     ·爬行器的递归方法第31页
     ·爬行器的非递归方法第31页
   ·爬行器的搜索策略第31-32页
   ·深度优先搜索策略第32-33页
   ·宽度优先搜索策略第33-35页
   ·爬行器模块的设计第35-36页
     ·网页下载模块的设计第35-36页
     ·网页解析模块的设计第36页
   ·本章小结第36-37页
第5章 爬行器系统的实现第37-52页
   ·网页下载模块的实现第37-41页
     ·HTTP类第37-38页
     ·Set_Request函数的实现第38-39页
     ·read_header函数的实现第39页
     ·Fetch函数的实现第39-40页
     ·read_body函数的实现第40-41页
   ·网页解析的设计与实现第41-43页
     ·Page类第41-42页
     ·GetContentLength函数的实现第42页
     ·GetLocation函数的实现第42-43页
     ·标签容器第43页
   ·crawler类第43-47页
     ·crawler类的实现第43-45页
     ·unvisiteurl和visitedurl的实现第45-46页
     ·GetNewUrl函数的实现第46-47页
   ·数据库的实现及MD5加密第47-48页
   ·多线程的设计与实现第48-49页
   ·main函数第49-50页
   ·实验第50页
   ·爬行器的评价第50-51页
   ·本章小结第51-52页
第6章 工作的总结与展望第52-54页
   ·工作项目的总结第52页
   ·工作项目的展望第52-54页
参考文献第54-56页
致谢第56-57页
摘要第57-60页
Abstract第60-62页

论文共62页,点击 下载论文
上一篇:分布式数据库备份系统的研究与实现
下一篇:基于数字图像处理的车型识别技术研究