摘要 | 第1-6页 |
ABSTRACT | 第6-11页 |
1 绪论 | 第11-15页 |
·论文的背景 | 第11-12页 |
·国内外研究现状 | 第12-13页 |
·研究的目的及意义 | 第13-14页 |
·本文的组织工作 | 第14-15页 |
2 垂直搜索的工作原理及关键策略 | 第15-28页 |
·爬虫原理与爬行策略 | 第15-18页 |
·主题相关度计算策略 | 第18-23页 |
·中文分词策略简介 | 第23-27页 |
·主题向量的建立策略 | 第27页 |
·本章小结 | 第27-28页 |
3 常用的垂直搜索的爬虫爬行算法研究 | 第28-41页 |
·传统网络爬虫的爬行算法 | 第28-29页 |
·主题爬虫的爬行算法 | 第29-40页 |
·本章小结 | 第40-41页 |
4 PAGERANK算法和HITS算法的分析与改进 | 第41-56页 |
·PAGERANK算法的基本思想 | 第41-43页 |
·PAGERANK算法的分析与改进 | 第43-48页 |
·垂直搜索的阀值设立的考虑因素 | 第48-49页 |
·HITS算法的基本思想 | 第49-50页 |
·HITS算法的过程 | 第50-53页 |
·基于HITS算法改进的PRH算法 | 第53-54页 |
·基于HITS算法的改进的PRA算法 | 第54-55页 |
·本章小结 | 第55-56页 |
5 改进算法的模拟实验与结果分析 | 第56页 |
·实验环境 | 第56-61页 |
·实验的设计 | 第56-57页 |
·实验的实现 | 第57-58页 |
·实验的结果及分析 | 第58-61页 |
6 总结与展望 | 第61-62页 |
致谢 | 第62-63页 |
参考文献 | 第63-67页 |
攻读硕士期间主要成果 | 第67页 |