基于页面划分的网面预测
提要 | 第1-7页 |
第1章 引言 | 第7-11页 |
·关于搜索引擎技术和面向主题的爬行技术 | 第7-8页 |
·网页预测面临的技术挑战 | 第8-10页 |
·论文的主要工作 | 第10-11页 |
第2章 网页预测的相关技术 | 第11-28页 |
·相关术语 | 第11-15页 |
·离线初始化阶段 | 第12-13页 |
·在线爬行阶段 | 第13-15页 |
·网页预测的相关技术 | 第15-27页 |
·获取相关的领域知识 | 第15-21页 |
·穿越隧道(tunnel)页面 | 第21-24页 |
·在线进行机器学习 | 第24-27页 |
·总结 | 第27-28页 |
第3章 基于页面划分的网页预测 | 第28-42页 |
·分析现有的网页预测方法 | 第28-30页 |
·页面划分方法 | 第30-32页 |
·基于页面划分的网页预测 | 第32-40页 |
·算法的基本模型 | 第32-34页 |
·基于内容信息的预测 | 第34-36页 |
·基于页面地址(URL)信息的预测 | 第36-37页 |
·基于父链接信息的预测 | 第37-39页 |
·基于兄弟链接信息的预测 | 第39页 |
·加权兴趣度 | 第39-40页 |
·总结 | 第40-42页 |
第4章 算法的系统实现和相关的实验分析 | 第42-52页 |
·系统实现 | 第42-47页 |
·系统组件 | 第42-43页 |
·算法描述 | 第43-47页 |
·实验分析 | 第47-51页 |
·与随机爬行算法的性能对比 | 第47页 |
·基于不同类型信息进行预测的对比 | 第47-49页 |
·基于不同的爬行起始页面进行预测的对比 | 第49-51页 |
·相关领域知识的复用 | 第51页 |
·新算法可能的改进 | 第51-52页 |
第5章 结束语 | 第52-54页 |
·所作工作总结 | 第52页 |
·对未来工作的展望 | 第52-54页 |
参考文献 | 第54-55页 |
摘要 | 第55-57页 |
ABSTRACT | 第57-60页 |
致谢 | 第60-61页 |
导师及作者简介 | 第61页 |