| 摘要 | 第4-5页 |
| Abstract | 第5页 |
| 1 绪论 | 第7-18页 |
| 1.1 研究目的及意义 | 第7页 |
| 1.2 国内外研究现状 | 第7-16页 |
| 1.3 研究目标及所做的工作 | 第16页 |
| 1.4 论文的组织结构 | 第16-18页 |
| 2 网页正文抽取 | 第18-32页 |
| 2.1 网页区域分割 | 第18-22页 |
| 2.2 网页正文标题提取 | 第22-23页 |
| 2.3 网页正文区域识别 | 第23-26页 |
| 2.4 实验结果与分析 | 第26-31页 |
| 2.5 本章小结 | 第31-32页 |
| 3 链接评价 | 第32-41页 |
| 3.1 网页的主题相关度计算 | 第32-37页 |
| 3.2 链接的优先度计算 | 第37-39页 |
| 3.3 链接的分级管理 | 第39-40页 |
| 3.4 本章小结 | 第40-41页 |
| 4 聚焦爬虫实验与分析 | 第41-48页 |
| 4.1 聚焦爬虫原型系统 | 第41-42页 |
| 4.2 爬虫性能评价标准 | 第42页 |
| 4.3 实验方案及结果分析 | 第42-47页 |
| 4.4 本章小结 | 第47-48页 |
| 5 总结与展望 | 第48-50页 |
| 5.1 全文总结 | 第48页 |
| 5.2 存在的问题 | 第48-49页 |
| 5.3 研究展望 | 第49-50页 |
| 致谢 | 第50-51页 |
| 参考文献 | 第51-55页 |