面向垂直搜索的聚焦爬虫研究及应用

摘要	第1-4页
ABSTRACT	第4-11页
第1章绪论	第11-19页
·研究背景	第11-17页
·垂直搜索	第12-14页
·网络爬虫	第14页
·垂直搜索的发展及面临的问题	第14-17页
·研究内容	第17页
·应用目标	第17页
·本文结构组织	第17-18页
·本章小结	第18-19页
第2章面向垂直搜索的聚焦爬虫研究综述	第19-25页
·引言	第19页
·概念描述	第19页
·工作原理与流程	第19-20页
·关键技术分析	第20-23页
·发展趋势	第23-24页
·本章小结	第24-25页
第3章网页抓取与信息提取技术的应用研究	第25-36页
·引言	第25页
·网络爬虫HERITRIX	第25-31页
·Heritrix 项目简介	第25-26页
·Heritrix 架构设计分析	第26-30页
·Heritrix 的扩展与定制	第30-31页
·网页解析利器WEB-HARVEST	第31-35页
·Web-Harvest 项目简介	第31-32页
·Web-Harvest 架构设计分析	第32-35页
·Web-Harvest 的扩展点	第35页
·本章小结	第35-36页
第4章招聘信息搜索的聚焦爬虫设计与实现	第36-56页
·引言	第36页
·需求分析	第36-38页
·目标	第36-37页
·功能需求	第37页
·性能需求	第37-38页
·抓取对象及目标站点的分析	第38-39页
·抓取对象的元数据分析	第38页
·抓取站点分析	第38-39页
·系统设计	第39-53页
·开发环境	第39-40页
·核心技术	第40-41页
·数据库设计	第41-42页
·概要设计	第42-44页
·详细设计	第44-53页
·代码实现	第53-55页
·本章小结	第55-56页
第5章总结与展望	第56-58页
·本文完成的主要研究及应用工作	第56页
·本文的主要贡献以及创新点	第56-57页
·进一步的研究工作	第57-58页
参考文献	第58-59页
附录1 工程代码结构示意图	第59-60页
附录2 核心程序源代码	第60-72页
致谢	第72页