聚焦爬行系统的设计—算法视角
摘要 | 第1-4页 |
Abstract | 第4-7页 |
第1章 绪论 | 第7-12页 |
·研究背景 | 第7-9页 |
·研究现状 | 第9-10页 |
·研究方法与论文组织 | 第10-12页 |
第2章 聚焦爬虫模型 | 第12-26页 |
·通用爬虫模型 | 第12-15页 |
·聚焦爬虫模型 | 第15-16页 |
·主题的表达 | 第16-17页 |
·种子 URL的选择 | 第17-18页 |
·搜索策略 | 第18-26页 |
·宽度优先策略 | 第18-19页 |
·最好优先策略 | 第19-20页 |
·语境图 | 第20-21页 |
·Web智能 Agent | 第21-23页 |
·霍普菲尔德模型与扩展激活算法 | 第23-26页 |
第3章 web分析算法 | 第26-48页 |
·基于内容的 Web分析算法 | 第26-34页 |
·基于向量空间的文本相似性度量方法 | 第26-30页 |
·基于链接描述文字和邻近信息的算法 | 第30-34页 |
·基于链接结构的 Web分析算法 | 第34-48页 |
·前向链接数和反向链接数 | 第35-36页 |
·PageRank | 第36-39页 |
·HITS | 第39-44页 |
·Web社区与聚焦爬行 | 第44-45页 |
·基于链接结构算法的深入讨论 | 第45-48页 |
第4章 设计与实验 | 第48-59页 |
·爬虫设计 | 第48-55页 |
·首次爬行算法 | 第48-50页 |
·二次爬行算法 | 第50-55页 |
·实验结果 | 第55-59页 |
第5章 总结 | 第59-60页 |
参考文献 | 第60-64页 |
硕士期间发表论文 | 第64-65页 |
致谢 | 第65页 |