摘要 | 第1-5页 |
Abstract | 第5-9页 |
第一章 绪论 | 第9-11页 |
·论文的研究背景和意义 | 第9页 |
·论文的主要工作 | 第9-10页 |
·论文的组织结构 | 第10-11页 |
第二章 相关技术研究 | 第11-26页 |
·搜索引擎以及技术架构 | 第11-13页 |
·搜索引擎的分类及发展 | 第11-12页 |
·搜索引擎工作原理 | 第12-13页 |
·爬虫系统相关 | 第13-25页 |
·爬虫系统的分类 | 第13-14页 |
·通用爬虫框架 | 第14-15页 |
·网页抓取算法 | 第15-19页 |
·网页更新算法 | 第19-20页 |
·网页去重算法 | 第20-22页 |
·礼貌性抓取 | 第22-23页 |
·分布式爬虫 | 第23-25页 |
·本章小结 | 第25-26页 |
第三章 CWebSpider 系统总体设计 | 第26-31页 |
·CWebSpider 架构设计 | 第26-31页 |
·系统总体结构 | 第26页 |
·CWebSpider 详细框架 | 第26-28页 |
·CWebSpider 流程图以及类图 | 第28-31页 |
第四章 CWebSpider 系统主要功能关键算法介绍 | 第31-54页 |
·URL 抓取器 | 第31-42页 |
·网络层设计 | 第31-36页 |
·应用层设计 | 第36-42页 |
·调度器 | 第42-48页 |
·URL 调度算法 | 第42-45页 |
·网页不重复抓取算法 | 第45-48页 |
·抽取器 | 第48-53页 |
·本章小结 | 第53-54页 |
第五章 CWebSpider 系统性能评测 | 第54-57页 |
第六章 总结与展望 | 第57-58页 |
参考文献 | 第58-61页 |
致谢 | 第61页 |