首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于链接背景信息的启发式主题爬行

第1章 引言第1-13页
   ·主题爬行产生背景及应用领域第7-8页
   ·选题方向及其意义第8-11页
   ·论文的主要研究内容和结构安排第11-13页
第2章 相关知识研究第13-23页
   ·相关术语第13-17页
     ·初始化阶段第14-15页
     ·在线爬行阶段第15-17页
   ·经典爬行程序介绍第17-18页
     ·宽度优先爬行程序第17页
     ·BestFirst 爬行程序第17-18页
   ·HTML 标志树第18-23页
     ·HTML 代码与标志树的对应关系第18-19页
     ·系统组件第19-20页
     ·链接背景信息提取技术第20-23页
第3章 基于链接背景信息的启发式主题爬行第23-36页
   ·链接背景信息提取算法第23-24页
   ·以链接背景信息为指导的主题爬行实验第24-29页
     ·初始化阶段第24-27页
     ·链接评分函数第27页
     ·在线爬行阶段第27-29页
   ·引入启发式规则第29-33页
     ·“邻近目录优先算法”(VirtualNearnessAlg)第30-32页
     ·“无关目录屏蔽算法”(IrrelevantDirAlg)第32-33页
   ·基于链接背景信息的启发式主题爬行第33-36页
第4章 实验第36-43页
   ·实验结果的评价方法第36-37页
   ·实验数据及工具第37-38页
   ·实验结果以及分析第38-43页
     ·HFCGLC 爬行程序的实验性能说明第38-39页
     ·LLC 爬行程序与其他爬行程序之间的对比实验第39-41页
     ·HFCGLC 与LLC 两种爬行程序之间的对比实验第41-43页
第5章 结论与未来工作第43-45页
参考文献第45-47页
摘要第47-49页
ABSTRACT第49-52页
致谢第52-53页
导师及作者简介第53页

论文共53页,点击 下载论文
上一篇:语文教学中创造性思维的培养
下一篇:丰富环境对大鼠成瘾行为和早期应激所致行为损害以及海马突触可塑性的影响