基于链接上下文的网页预测

第一章绪论	第1-15页
·面向主题的搜索引擎技术	第7-8页
·选题的意义	第8-13页
·网页预测在主题爬行中的重要作用	第8-11页
·网页预测方面所面临的技术挑战	第11页
·提取链接上下文的作用和意义	第11-13页
·本文的主要研究内容和结构安排	第13-15页
第二章网页预测的相关技术	第15-23页
·网页主题的表示和判断方法	第15-17页
·基于链接的网页预测技术	第17-21页
·基于链接结构的网页预测技术	第17-18页
·基于链接锚文本内容的网页预测技术	第18-21页
·比较实验使用的爬行器介绍	第21-22页
·总结	第22-23页
第三章链接上下文的提取算法及实现	第23-39页
·链接上下文的提取工具	第23-27页
·规范网页工具JTidy	第23-25页
·解析网页工具DOM	第25-27页
·链接上下文的提取方法	第27-32页
·DOM 偏置方法	第27-30页
·聚合节点方法	第30-32页
·A-GPANT 算法	第32-35页
·分析现有的方法	第32-34页
·改进算法的描述	第34-35页
·实验与分析	第35-39页
·性能参数	第35-37页
·实验分析	第37-39页
第四章网页主题描述技术及实现	第39-47页
·传统的主题描述获取方法	第39-40页
·利用反向链接的主题描述获取方法	第40-44页
·传统方法的不足	第40-41页
·反向链接锚文本的特点	第41-43页
·利用反向链接的主题特征生成方法	第43-44页
·实验与分析	第44-47页
第五章算法的系统实现和比较实验	第47-55页
·系统实现	第47-52页
·系统组件	第47-48页
·算法描述	第48-51页
·Seed URLs 的选择	第51页
·性能度量值	第51-52页
·实验与分析	第52-53页
·算法可能的技术改进	第53-55页
第六章结论和工作展望	第55-56页
参考文献	第56-59页
摘要	第59-61页
ABSTRACT	第61-64页
致谢	第64-65页
导师及作者简介	第65页