首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于网页分块技术的主题爬行

内容提要第1-6页
第一章 绪论第6-12页
   ·面向主题的爬行技术第6-10页
   ·网页分块的提出第10页
   ·本文的主要工作及结构安排第10-12页
第二章 主题爬行与网页分块技术第12-24页
   ·主题爬行的原理第12-16页
     ·离线初试化阶段第13-14页
     ·在线初试化阶段第14-16页
   ·网页分块技术第16-19页
     ·网页分块技术相关算法的介绍第16-18页
     ·网页分块技术的应用第18-19页
   ·网页分块在主题爬行中的主要作用第19-24页
     ·多主题和tunnel问题第19-21页
     ·网页去重第21-22页
     ·网页内容预测第22-24页
第三章 网页分块算法第24-41页
   ·网页的预处理第24-26页
     ·网页的净化第24-25页
     ·构建DOM树第25-26页
   ·分块算法第26-36页
     ·视觉信息第26-28页
     ·标签信息第28-29页
     ·链接信息第29-31页
     ·算法描述第31-36页
   ·内容块的识别和合并第36-41页
     ·内容块的特征标识第37-38页
     ·内容块的合并第38-40页
     ·内容块重要性的判断第40-41页
第四章 系统实现和实验结果分析第41-50页
   ·系统实现第41-44页
   ·实验结果分析第44-49页
   ·算法的可能改进第49-50页
第五章 工作总结和未来的工作第50-53页
   ·工作总结第50页
   ·未来的工作第50-53页
参考文献第53-55页
摘要第55-58页
Abstract第58-61页
致谢第61-62页
导师与作者简介第62页

论文共62页,点击 下载论文
上一篇:大视场纤维细丝的图像处理与图像拼接
下一篇:中国农业保险发展问题研究