摘要 | 第1-6页 |
ABSTRACT | 第6-12页 |
第一章 绪论 | 第12-20页 |
·搜索引擎简介 | 第12-16页 |
·搜索引擎的发展历史 | 第12-13页 |
·搜索引擎的分类 | 第13-14页 |
·搜索引擎的工作原理 | 第14-15页 |
·专业搜索引擎介绍 | 第15-16页 |
·网络爬虫简介 | 第16-20页 |
·网络爬虫概述 | 第16-17页 |
·主题网络爬虫介绍 | 第17-18页 |
·开源网络爬虫策略 | 第18-20页 |
第二章 核心研究成果 | 第20-30页 |
·主题优先抓取技术 | 第20-25页 |
·网页链接结构 | 第20-21页 |
·相关度计算 | 第21-22页 |
·主题抓取算法 | 第22-25页 |
·数据存储管理 | 第25-30页 |
·postgresq1数据库集群 | 第25-26页 |
·postgresq1数据库集群在资源库中的应用 | 第26-27页 |
·postgresq1数据库集群在连接地址库中的应用 | 第27-30页 |
第三章 主题网络爬虫的实现 | 第30-56页 |
·主题爬虫系统要求 | 第30-31页 |
·系统稳定 | 第30页 |
·主题相关 | 第30页 |
·抓取高效 | 第30-31页 |
·后期易维护 | 第31页 |
·主题爬虫分析与设计 | 第31-36页 |
·系统体系结构 | 第31-33页 |
·数据存储架构 | 第33-36页 |
·各模块详细设计与实现 | 第36-54页 |
·数据采集模块 | 第36-45页 |
·主题判断模块 | 第45-46页 |
·数据抽取模块 | 第46-47页 |
·数据存储模块 | 第47-51页 |
·客户端管理模块 | 第51-53页 |
·日志模块 | 第53-54页 |
·系统总结 | 第54-56页 |
第四章 测试结果 | 第56-64页 |
·运行环境和配置情况 | 第56-58页 |
·开发环境 | 第56页 |
·系统配置 | 第56-58页 |
·结果展示和分析 | 第58-64页 |
·界面及结果显示 | 第58-61页 |
·结果分析 | 第61-64页 |
第五章 总结与展望 | 第64-66页 |
·总结 | 第64页 |
·展望 | 第64-66页 |
参考文献 | 第66-70页 |
致谢 | 第70-72页 |
研究成果及发表的学术论文 | 第72-74页 |
作者和导师简介 | 第74-75页 |
北京化工大学 硕士研究生学位论文答辩委员会决议书 | 第75-76页 |