首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于网站目录及链接分析的Spider爬行策略的研究与实现

摘要第1-6页
ABSTRACT第6-12页
第一章 引言第12-18页
   ·课题研究目的和意义第12页
   ·搜索引擎的发展历程及现状第12-15页
     ·搜索引擎发展历程第12-14页
     ·搜索引擎分类第14-15页
   ·搜索引擎的基本框架及工作原理第15-18页
第二章 基于链接分析的网络爬虫算法第18-26页
   ·网络爬虫介绍第18-19页
     ·网络爬虫概述第18页
     ·网络爬虫的基本组成及工作原理第18-19页
   ·网络爬虫搜索策略的发展及现状第19-21页
   ·注重网页质量的网络爬虫搜索策略第21-26页
     ·Pagerank第21-22页
     ·HITS第22-23页
     ·Backlink和OPIC第23页
     ·几种搜索策略的分析比较第23-26页
第三章 理论基础及相关技术第26-32页
   ·数据库的选择第26页
   ·Jeff Heaton Spider介绍第26-29页
     ·Jeff Heaton Spider体系结构第27页
     ·各功能模块说明第27-28页
     ·系统优缺点分析第28-29页
   ·其他技术第29-32页
     ·多线程第29页
     ·连接池及声明池第29-32页
第四章 爬行策略设计及实现第32-50页
   ·Web的结构分析第32-35页
     ·超链的分析及分类第32-34页
     ·Web的网站目录组织形式第34-35页
   ·数据库设计第35-36页
   ·爬行策略设计第36-41页
   ·Spider的详细设计与实现第41-50页
     ·本策略Spider的体系结构第41页
     ·爬行模块第41-43页
     ·数据处理模块第43-46页
     ·数据记录模块第46-50页
第五章 实验结果第50-52页
   ·实验环境第50页
   ·实验结果及分析第50-52页
第六章 总结与展望第52-54页
   ·总结第52页
   ·展望第52-54页
参考文献第54-56页
致谢第56-58页
攻读硕士学位期间参加的科研课题和发表的学术论文第58-60页
作者和导师简介第60-61页
北京化工大学硕士研究生学位论文答辩委员会决议书第61-62页

论文共62页,点击 下载论文
上一篇:基于混合P2P结构的网格存储模型的研究
下一篇:基于Flex的网页游戏的研究与设计