| 摘要 | 第1-6页 |
| ABSTRACT | 第6-11页 |
| 1 绪论 | 第11-15页 |
| ·论文的背景 | 第11-12页 |
| ·国内外研究现状 | 第12-13页 |
| ·研究的目的及意义 | 第13-14页 |
| ·本文的组织工作 | 第14-15页 |
| 2 垂直搜索的工作原理及关键策略 | 第15-28页 |
| ·爬虫原理与爬行策略 | 第15-18页 |
| ·主题相关度计算策略 | 第18-23页 |
| ·中文分词策略简介 | 第23-27页 |
| ·主题向量的建立策略 | 第27页 |
| ·本章小结 | 第27-28页 |
| 3 常用的垂直搜索的爬虫爬行算法研究 | 第28-41页 |
| ·传统网络爬虫的爬行算法 | 第28-29页 |
| ·主题爬虫的爬行算法 | 第29-40页 |
| ·本章小结 | 第40-41页 |
| 4 PAGERANK算法和HITS算法的分析与改进 | 第41-56页 |
| ·PAGERANK算法的基本思想 | 第41-43页 |
| ·PAGERANK算法的分析与改进 | 第43-48页 |
| ·垂直搜索的阀值设立的考虑因素 | 第48-49页 |
| ·HITS算法的基本思想 | 第49-50页 |
| ·HITS算法的过程 | 第50-53页 |
| ·基于HITS算法改进的PRH算法 | 第53-54页 |
| ·基于HITS算法的改进的PRA算法 | 第54-55页 |
| ·本章小结 | 第55-56页 |
| 5 改进算法的模拟实验与结果分析 | 第56页 |
| ·实验环境 | 第56-61页 |
| ·实验的设计 | 第56-57页 |
| ·实验的实现 | 第57-58页 |
| ·实验的结果及分析 | 第58-61页 |
| 6 总结与展望 | 第61-62页 |
| 致谢 | 第62-63页 |
| 参考文献 | 第63-67页 |
| 攻读硕士期间主要成果 | 第67页 |