摘要 | 第4-5页 |
Abstract | 第5页 |
1 绪论 | 第7-18页 |
1.1 研究目的及意义 | 第7页 |
1.2 国内外研究现状 | 第7-16页 |
1.3 研究目标及所做的工作 | 第16页 |
1.4 论文的组织结构 | 第16-18页 |
2 网页正文抽取 | 第18-32页 |
2.1 网页区域分割 | 第18-22页 |
2.2 网页正文标题提取 | 第22-23页 |
2.3 网页正文区域识别 | 第23-26页 |
2.4 实验结果与分析 | 第26-31页 |
2.5 本章小结 | 第31-32页 |
3 链接评价 | 第32-41页 |
3.1 网页的主题相关度计算 | 第32-37页 |
3.2 链接的优先度计算 | 第37-39页 |
3.3 链接的分级管理 | 第39-40页 |
3.4 本章小结 | 第40-41页 |
4 聚焦爬虫实验与分析 | 第41-48页 |
4.1 聚焦爬虫原型系统 | 第41-42页 |
4.2 爬虫性能评价标准 | 第42页 |
4.3 实验方案及结果分析 | 第42-47页 |
4.4 本章小结 | 第47-48页 |
5 总结与展望 | 第48-50页 |
5.1 全文总结 | 第48页 |
5.2 存在的问题 | 第48-49页 |
5.3 研究展望 | 第49-50页 |
致谢 | 第50-51页 |
参考文献 | 第51-55页 |