搜索引擎中主题网络爬虫的研究与设计
摘要 | 第1-5页 |
Abstract | 第5-7页 |
第一章 绪论 | 第7-12页 |
·搜索引擎概念 | 第7页 |
·搜索引擎国内外发展概况 | 第7-8页 |
·选题的背景与意义 | 第8-10页 |
·论文组织 | 第10-12页 |
第二章 网络爬虫相关介绍 | 第12-18页 |
·开源网络爬虫 | 第12-13页 |
·通用爬虫的原理与模型 | 第13-14页 |
·主题爬虫相关介绍 | 第14-16页 |
·主题页面在WEB上的分布特征 | 第16-17页 |
·本章小结 | 第17-18页 |
第三章 主题爬虫关键算法研究 | 第18-30页 |
·主题表示方法 | 第18-19页 |
·权值的计算方法 | 第19-21页 |
·相关度算法 | 第21-26页 |
·启发式搜索策略 | 第26-27页 |
·基于分类器预测的算法 | 第27-28页 |
·隧道技术 | 第28页 |
·本章小结 | 第28-30页 |
第四章 SAS-Crawelr系统的设计 | 第30-43页 |
·SAS-crawler的系统结构 | 第30-33页 |
·种子页面生成 | 第33页 |
·主题确立 | 第33-34页 |
·页面的分析 | 第34-36页 |
·链接评价算法的改进 | 第36-39页 |
·基于模拟退火算法的爬行策略 | 第39-42页 |
·本章小节 | 第42-43页 |
第五章 实验结果与分析 | 第43-49页 |
·实验环境设置 | 第43页 |
·结果分析 | 第43-48页 |
·本章小结 | 第48-49页 |
第六章 总结与展望 | 第49-51页 |
·本文的工作总结 | 第49页 |
·下一步的工作 | 第49-51页 |
致谢 | 第51-52页 |
参考文献 | 第52-56页 |
附录 | 第56-57页 |
Appendix | 第57-58页 |
导师、作者简介 | 第58-59页 |