基于页面划分的网面预测
| 提要 | 第1-7页 |
| 第1章 引言 | 第7-11页 |
| ·关于搜索引擎技术和面向主题的爬行技术 | 第7-8页 |
| ·网页预测面临的技术挑战 | 第8-10页 |
| ·论文的主要工作 | 第10-11页 |
| 第2章 网页预测的相关技术 | 第11-28页 |
| ·相关术语 | 第11-15页 |
| ·离线初始化阶段 | 第12-13页 |
| ·在线爬行阶段 | 第13-15页 |
| ·网页预测的相关技术 | 第15-27页 |
| ·获取相关的领域知识 | 第15-21页 |
| ·穿越隧道(tunnel)页面 | 第21-24页 |
| ·在线进行机器学习 | 第24-27页 |
| ·总结 | 第27-28页 |
| 第3章 基于页面划分的网页预测 | 第28-42页 |
| ·分析现有的网页预测方法 | 第28-30页 |
| ·页面划分方法 | 第30-32页 |
| ·基于页面划分的网页预测 | 第32-40页 |
| ·算法的基本模型 | 第32-34页 |
| ·基于内容信息的预测 | 第34-36页 |
| ·基于页面地址(URL)信息的预测 | 第36-37页 |
| ·基于父链接信息的预测 | 第37-39页 |
| ·基于兄弟链接信息的预测 | 第39页 |
| ·加权兴趣度 | 第39-40页 |
| ·总结 | 第40-42页 |
| 第4章 算法的系统实现和相关的实验分析 | 第42-52页 |
| ·系统实现 | 第42-47页 |
| ·系统组件 | 第42-43页 |
| ·算法描述 | 第43-47页 |
| ·实验分析 | 第47-51页 |
| ·与随机爬行算法的性能对比 | 第47页 |
| ·基于不同类型信息进行预测的对比 | 第47-49页 |
| ·基于不同的爬行起始页面进行预测的对比 | 第49-51页 |
| ·相关领域知识的复用 | 第51页 |
| ·新算法可能的改进 | 第51-52页 |
| 第5章 结束语 | 第52-54页 |
| ·所作工作总结 | 第52页 |
| ·对未来工作的展望 | 第52-54页 |
| 参考文献 | 第54-55页 |
| 摘要 | 第55-57页 |
| ABSTRACT | 第57-60页 |
| 致谢 | 第60-61页 |
| 导师及作者简介 | 第61页 |