聚焦爬行系统的设计—算法视角
| 摘要 | 第1-4页 |
| Abstract | 第4-7页 |
| 第1章 绪论 | 第7-12页 |
| ·研究背景 | 第7-9页 |
| ·研究现状 | 第9-10页 |
| ·研究方法与论文组织 | 第10-12页 |
| 第2章 聚焦爬虫模型 | 第12-26页 |
| ·通用爬虫模型 | 第12-15页 |
| ·聚焦爬虫模型 | 第15-16页 |
| ·主题的表达 | 第16-17页 |
| ·种子 URL的选择 | 第17-18页 |
| ·搜索策略 | 第18-26页 |
| ·宽度优先策略 | 第18-19页 |
| ·最好优先策略 | 第19-20页 |
| ·语境图 | 第20-21页 |
| ·Web智能 Agent | 第21-23页 |
| ·霍普菲尔德模型与扩展激活算法 | 第23-26页 |
| 第3章 web分析算法 | 第26-48页 |
| ·基于内容的 Web分析算法 | 第26-34页 |
| ·基于向量空间的文本相似性度量方法 | 第26-30页 |
| ·基于链接描述文字和邻近信息的算法 | 第30-34页 |
| ·基于链接结构的 Web分析算法 | 第34-48页 |
| ·前向链接数和反向链接数 | 第35-36页 |
| ·PageRank | 第36-39页 |
| ·HITS | 第39-44页 |
| ·Web社区与聚焦爬行 | 第44-45页 |
| ·基于链接结构算法的深入讨论 | 第45-48页 |
| 第4章 设计与实验 | 第48-59页 |
| ·爬虫设计 | 第48-55页 |
| ·首次爬行算法 | 第48-50页 |
| ·二次爬行算法 | 第50-55页 |
| ·实验结果 | 第55-59页 |
| 第5章 总结 | 第59-60页 |
| 参考文献 | 第60-64页 |
| 硕士期间发表论文 | 第64-65页 |
| 致谢 | 第65页 |