首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于超链接搜索策略网络爬行器的设计与实现

提要第1-8页
第一章 绪论第8-14页
   ·研究背景第8-11页
     ·Web 信息资源第8-10页
     ·Web 信息资源的发展第10-11页
   ·研究的目的及意义第11-13页
   ·本文的主要工作第13-14页
第二章 搜索引擎介绍第14-35页
   ·搜索引擎简介第14页
   ·搜索引擎发展历史第14-15页
   ·搜索引擎分类第15-17页
   ·搜索引擎相关技术第17-22页
     ·爬行器第17-18页
     ·索引第18-19页
     ·存储第19-20页
     ·检索第20-21页
     ·爬行陷阱第21-22页
   ·经典搜索引擎Google第22-30页
     ·Google 的体系结构第22-25页
     ·Google 的数据结构第25-28页
     ·网页的等级值(Rank)计算第28-29页
     ·搜索过程第29-30页
   ·搜索引擎研究现状第30-35页
     ·Focus Project第30-31页
     ·CiteSeer & eBusiSearch第31-32页
     ·CORA第32页
     ·Harvest & Greenstone第32-33页
     ·OASIS第33-34页
     ·STIP第34-35页
第三章 基于超链接信息的搜索策略第35-40页
   ·宽度优先搜索的Web 网页爬行方法第35-36页
   ·利用超链接信息对搜索策略的改进第36-38页
   ·本文对基于超链接信息搜索策略的改进第38-40页
第四章 爬行器的设计与实现第40-57页
   ·爬行器总体设计第40-43页
     ·递归程序第40-41页
     ·非递归程序第41-42页
     ·爬行器工作流程第42-43页
   ·网页下载相关类的设计与实现第43-45页
     ·Attribute 类与AttributeList 类第43-44页
     ·HTTP 类与HTTPSocket 类第44-45页
   ·网页解析相关类的设计与实现第45-49页
     ·解析器工作流程第46页
     ·HTMLPage 类第46-47页
     ·HTTPTag 类第47-48页
     ·Parse 类与HTMLParser 类第48-49页
   ·Spider 类及其相关类第49-51页
     ·Spider 类第49-50页
     ·ISpiderReportable 接口第50页
     ·SpiderSQLWorkload 类第50页
     ·SpiderWorker 类第50-51页
   ·数据库的设计以及对改进型超链接策略的模拟第51-52页
     ·数据库存储设计第51页
     ·对改进型超链接搜索策略的模拟第51-52页
   ·实现中的难点第52-56页
     ·多线程的设计第52-53页
     ·多线程之间的通信第53-55页
     ·大小动态变化的线程池的设计与实现第55-56页
   ·实验第56-57页
第五章 总结与展望第57-58页
   ·总结第57页
   ·进一步工作第57-58页
参考文献第58-63页
摘要第63-67页
Abstract第67-71页
致谢第71页

论文共71页,点击 下载论文
上一篇:基于图像的虚拟场景绘制关键技术研究
下一篇:基于岗位素质模型的评价中心的构建与实施