| 摘要 | 第1-4页 |
| ABSTRACT | 第4-5页 |
| 目录 | 第5-6页 |
| 第一章 绪论 | 第6-12页 |
| ·背景 | 第6-11页 |
| ·军训网简介 | 第11页 |
| ·本文的工作 | 第11页 |
| ·本文的组织 | 第11-12页 |
| 第二章 主题蜘蛛概述 | 第12-21页 |
| ·主题蜘蛛的基本原理与结构 | 第12-13页 |
| ·军训网主题页面的分布特征 | 第13-14页 |
| ·主题描述 | 第14-15页 |
| ·文本分类 | 第15-21页 |
| 第三章 主题蜘蛛关键技术 | 第21-28页 |
| ·基于立即回报价值的搜索策略 | 第21-24页 |
| ·基于未来回报价值的搜索策略 | 第24-26页 |
| ·搜索策略分析 | 第26-28页 |
| 第四章 主题蜘蛛分析与设计 | 第28-39页 |
| ·主题蜘蛛的设计目标 | 第28页 |
| ·系统模型 | 第28-29页 |
| ·主题描述 | 第29-31页 |
| ·爬行模块 | 第31-33页 |
| ·信息提取 | 第33-36页 |
| ·页面过滤 | 第36页 |
| ·链接过滤 | 第36-39页 |
| 第五章 测试结果与分析 | 第39-43页 |
| ·测试标准 | 第39页 |
| ·系统实现 | 第39-40页 |
| ·测试数据与结果分析 | 第40-43页 |
| 第六章 总结与展望 | 第43-44页 |
| 致谢 | 第44-45页 |
| 参考文献 | 第45-47页 |