垂直搜索引擎爬虫系统的研究与实现
摘要 | 第1-6页 |
Abstract | 第6-8页 |
第一章 引言 | 第8-11页 |
·课题研究的意义和产生背景 | 第8-9页 |
·国内外研究现状和介绍 | 第9-11页 |
第二章 搜索引擎和垂直搜索引擎介绍 | 第11-18页 |
·分类 | 第11-12页 |
·目录式搜索引擎 | 第11-12页 |
·机器人搜索引擎 | 第12页 |
·元搜索引擎 | 第12页 |
·性能指标 | 第12-13页 |
·主要技术 | 第13-14页 |
·搜索器 | 第13页 |
·索引器 | 第13-14页 |
·检索器 | 第14页 |
·用户接口 | 第14页 |
·什么是垂直搜索 | 第14页 |
·垂直搜索与传统搜索的区别 | 第14-15页 |
·垂直搜索的内容来源 | 第15页 |
·垂直搜索的几个关键技术 | 第15-16页 |
·聚焦、实时和可管理的网页采集技术 | 第15-16页 |
·从非结构化内容到结构化数据的网页解析技术 | 第16页 |
·精、准、全的全文索引和联合检索技术 | 第16页 |
·高度智能化的文本挖掘技术 | 第16页 |
·垂直搜索引擎站点的8条准则 | 第16-17页 |
·本文解决的问题 | 第17-18页 |
第三章 Petri网和有色网 | 第18-22页 |
·Petri网是计算机的世界观 | 第18页 |
·Petri网介绍 | 第18-20页 |
·Petri网结构 | 第18-19页 |
·前集和后集 | 第19页 |
·Petri网 | 第19-20页 |
·Petri网的观点 | 第20页 |
·Petri网系统分析 | 第20页 |
·Petri网的本质 | 第20页 |
·Petri网应用 | 第20-21页 |
·CPN介绍 | 第21-22页 |
第四章 爬虫系统模型 | 第22-32页 |
·爬虫的工作原理 | 第22-23页 |
·系统说明 | 第23-26页 |
·新闻资讯类网页的抓取策略 | 第23-25页 |
·供求类网页的抓取策略 | 第25-26页 |
·价格类网页的抓取策略 | 第26页 |
·爬虫设计的关键技术 | 第26-27页 |
·并发性 | 第26页 |
·url的获取 | 第26页 |
·url的去重 | 第26-27页 |
·内容过滤 | 第27页 |
·爬虫的调度规则 | 第27页 |
·爬虫的功能 | 第27页 |
·爬虫的CPN模型及分析 | 第27-32页 |
·库所说明 | 第27-30页 |
·变迁说明 | 第30页 |
·系统初始状态 | 第30页 |
·模型分析 | 第30-32页 |
第五章 爬虫的实现和性能分析 | 第32-49页 |
·UML介绍 | 第32-35页 |
·什么是UML | 第32页 |
·UML的内容 | 第32-34页 |
·UML的主要特点 | 第34页 |
·UML的应用领域 | 第34-35页 |
·爬虫的UML模型 | 第35-45页 |
·用例图 | 第35-37页 |
·类图 | 第37-44页 |
·状态图 | 第44-45页 |
·爬虫系统数据库说明 | 第45-48页 |
·爬虫系统性能分析 | 第48-49页 |
结束语 | 第49-50页 |
致谢 | 第50-51页 |
参考文献 | 第51-53页 |
附录 | 第53-54页 |