垂直搜索引擎爬虫系统的研究与实现
| 摘要 | 第1-6页 |
| Abstract | 第6-8页 |
| 第一章 引言 | 第8-11页 |
| ·课题研究的意义和产生背景 | 第8-9页 |
| ·国内外研究现状和介绍 | 第9-11页 |
| 第二章 搜索引擎和垂直搜索引擎介绍 | 第11-18页 |
| ·分类 | 第11-12页 |
| ·目录式搜索引擎 | 第11-12页 |
| ·机器人搜索引擎 | 第12页 |
| ·元搜索引擎 | 第12页 |
| ·性能指标 | 第12-13页 |
| ·主要技术 | 第13-14页 |
| ·搜索器 | 第13页 |
| ·索引器 | 第13-14页 |
| ·检索器 | 第14页 |
| ·用户接口 | 第14页 |
| ·什么是垂直搜索 | 第14页 |
| ·垂直搜索与传统搜索的区别 | 第14-15页 |
| ·垂直搜索的内容来源 | 第15页 |
| ·垂直搜索的几个关键技术 | 第15-16页 |
| ·聚焦、实时和可管理的网页采集技术 | 第15-16页 |
| ·从非结构化内容到结构化数据的网页解析技术 | 第16页 |
| ·精、准、全的全文索引和联合检索技术 | 第16页 |
| ·高度智能化的文本挖掘技术 | 第16页 |
| ·垂直搜索引擎站点的8条准则 | 第16-17页 |
| ·本文解决的问题 | 第17-18页 |
| 第三章 Petri网和有色网 | 第18-22页 |
| ·Petri网是计算机的世界观 | 第18页 |
| ·Petri网介绍 | 第18-20页 |
| ·Petri网结构 | 第18-19页 |
| ·前集和后集 | 第19页 |
| ·Petri网 | 第19-20页 |
| ·Petri网的观点 | 第20页 |
| ·Petri网系统分析 | 第20页 |
| ·Petri网的本质 | 第20页 |
| ·Petri网应用 | 第20-21页 |
| ·CPN介绍 | 第21-22页 |
| 第四章 爬虫系统模型 | 第22-32页 |
| ·爬虫的工作原理 | 第22-23页 |
| ·系统说明 | 第23-26页 |
| ·新闻资讯类网页的抓取策略 | 第23-25页 |
| ·供求类网页的抓取策略 | 第25-26页 |
| ·价格类网页的抓取策略 | 第26页 |
| ·爬虫设计的关键技术 | 第26-27页 |
| ·并发性 | 第26页 |
| ·url的获取 | 第26页 |
| ·url的去重 | 第26-27页 |
| ·内容过滤 | 第27页 |
| ·爬虫的调度规则 | 第27页 |
| ·爬虫的功能 | 第27页 |
| ·爬虫的CPN模型及分析 | 第27-32页 |
| ·库所说明 | 第27-30页 |
| ·变迁说明 | 第30页 |
| ·系统初始状态 | 第30页 |
| ·模型分析 | 第30-32页 |
| 第五章 爬虫的实现和性能分析 | 第32-49页 |
| ·UML介绍 | 第32-35页 |
| ·什么是UML | 第32页 |
| ·UML的内容 | 第32-34页 |
| ·UML的主要特点 | 第34页 |
| ·UML的应用领域 | 第34-35页 |
| ·爬虫的UML模型 | 第35-45页 |
| ·用例图 | 第35-37页 |
| ·类图 | 第37-44页 |
| ·状态图 | 第44-45页 |
| ·爬虫系统数据库说明 | 第45-48页 |
| ·爬虫系统性能分析 | 第48-49页 |
| 结束语 | 第49-50页 |
| 致谢 | 第50-51页 |
| 参考文献 | 第51-53页 |
| 附录 | 第53-54页 |