搜索引擎中主题网络爬虫的研究与设计
| 摘要 | 第1-5页 |
| Abstract | 第5-7页 |
| 第一章 绪论 | 第7-12页 |
| ·搜索引擎概念 | 第7页 |
| ·搜索引擎国内外发展概况 | 第7-8页 |
| ·选题的背景与意义 | 第8-10页 |
| ·论文组织 | 第10-12页 |
| 第二章 网络爬虫相关介绍 | 第12-18页 |
| ·开源网络爬虫 | 第12-13页 |
| ·通用爬虫的原理与模型 | 第13-14页 |
| ·主题爬虫相关介绍 | 第14-16页 |
| ·主题页面在WEB上的分布特征 | 第16-17页 |
| ·本章小结 | 第17-18页 |
| 第三章 主题爬虫关键算法研究 | 第18-30页 |
| ·主题表示方法 | 第18-19页 |
| ·权值的计算方法 | 第19-21页 |
| ·相关度算法 | 第21-26页 |
| ·启发式搜索策略 | 第26-27页 |
| ·基于分类器预测的算法 | 第27-28页 |
| ·隧道技术 | 第28页 |
| ·本章小结 | 第28-30页 |
| 第四章 SAS-Crawelr系统的设计 | 第30-43页 |
| ·SAS-crawler的系统结构 | 第30-33页 |
| ·种子页面生成 | 第33页 |
| ·主题确立 | 第33-34页 |
| ·页面的分析 | 第34-36页 |
| ·链接评价算法的改进 | 第36-39页 |
| ·基于模拟退火算法的爬行策略 | 第39-42页 |
| ·本章小节 | 第42-43页 |
| 第五章 实验结果与分析 | 第43-49页 |
| ·实验环境设置 | 第43页 |
| ·结果分析 | 第43-48页 |
| ·本章小结 | 第48-49页 |
| 第六章 总结与展望 | 第49-51页 |
| ·本文的工作总结 | 第49页 |
| ·下一步的工作 | 第49-51页 |
| 致谢 | 第51-52页 |
| 参考文献 | 第52-56页 |
| 附录 | 第56-57页 |
| Appendix | 第57-58页 |
| 导师、作者简介 | 第58-59页 |