摘要 | 第1-5页 |
Abstract | 第5-8页 |
第1章 引言 | 第8-15页 |
·研究背景和意义 | 第8-9页 |
·主题爬虫的国内外研究现状 | 第9-14页 |
·基于文字内容的启发式方法 | 第9-11页 |
·基于WEB超链图的评价方法 | 第11-12页 |
·基于分类器预测的方法 | 第12-13页 |
·其他主题爬行方法 | 第13-14页 |
·本文的主要工作和内容安排 | 第14-15页 |
第2章 基于支持向量机分类算法的主题爬虫的算法研究 | 第15-28页 |
·支持向量机的分类算法原理 | 第15-17页 |
·网页的数学描述 | 第17-18页 |
·网页的SVM主题分类算法 | 第18-20页 |
·构建分类模型 | 第18-19页 |
·主题分类算法 | 第19-20页 |
·SVM分类器的实现 | 第20-23页 |
·SVM分类器的实验 | 第23-27页 |
·本章小结 | 第27-28页 |
第3章 主题爬虫Percaspider的设计和实现 | 第28-50页 |
·主题爬虫的性能评价指标 | 第28页 |
·Percaspider的设计 | 第28-32页 |
·Percaspider的主要功能模块及关键技术 | 第32-44页 |
·HTTP获取模块 | 第32-37页 |
·URL队列管理模块 | 第37-39页 |
·链接分析模块 | 第39-40页 |
·分类预测模块 | 第40-41页 |
·增量检测获取模块及其关键技术 | 第41页 |
·线程管理模块 | 第41-44页 |
·Percaspider的实现 | 第44-49页 |
·Percaspider的实现环境 | 第44页 |
·Percaspider的测试与运行 | 第44-47页 |
·Percaspider的测试效果分析 | 第47-49页 |
·本章小结 | 第49-50页 |
第4章 总结与展望 | 第50-52页 |
·工作总结 | 第50页 |
·研究展望 | 第50-52页 |
参考文献 | 第52-55页 |
研究生期间发表论文 | 第55-56页 |
致谢 | 第56-57页 |
附录 | 第57-67页 |