摘要 | 第1-4页 |
ABSTRACT | 第4-5页 |
目录 | 第5-6页 |
第一章 绪论 | 第6-12页 |
·背景 | 第6-11页 |
·军训网简介 | 第11页 |
·本文的工作 | 第11页 |
·本文的组织 | 第11-12页 |
第二章 主题蜘蛛概述 | 第12-21页 |
·主题蜘蛛的基本原理与结构 | 第12-13页 |
·军训网主题页面的分布特征 | 第13-14页 |
·主题描述 | 第14-15页 |
·文本分类 | 第15-21页 |
第三章 主题蜘蛛关键技术 | 第21-28页 |
·基于立即回报价值的搜索策略 | 第21-24页 |
·基于未来回报价值的搜索策略 | 第24-26页 |
·搜索策略分析 | 第26-28页 |
第四章 主题蜘蛛分析与设计 | 第28-39页 |
·主题蜘蛛的设计目标 | 第28页 |
·系统模型 | 第28-29页 |
·主题描述 | 第29-31页 |
·爬行模块 | 第31-33页 |
·信息提取 | 第33-36页 |
·页面过滤 | 第36页 |
·链接过滤 | 第36-39页 |
第五章 测试结果与分析 | 第39-43页 |
·测试标准 | 第39页 |
·系统实现 | 第39-40页 |
·测试数据与结果分析 | 第40-43页 |
第六章 总结与展望 | 第43-44页 |
致谢 | 第44-45页 |
参考文献 | 第45-47页 |