首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于网页分块的论坛爬虫关键技术研究

摘要第1-5页
Abstract第5-9页
第1章 绪论第9-17页
   ·课题研究背景和意义第9-10页
     ·研究背景第9页
     ·研究意义第9-10页
   ·国内外相关研究和综述第10-15页
     ·网络爬虫第10-14页
     ·网页分块第14-15页
   ·课题研究内容第15-16页
   ·本文的结构安排第16-17页
第2章 论坛爬虫的爬行策略关键技术分析第17-24页
   ·引言第17页
   ·网络论坛概述第17-18页
     ·网络论坛中的术语解释第17-18页
     ·网络论坛的特征第18页
   ·网络爬虫概述第18-20页
     ·爬虫设计概述第19-20页
     ·爬虫的性能优化第20页
   ·论坛爬虫的爬行策略分析第20-23页
     ·传统爬虫的爬行策略第20-22页
     ·传统策略爬行论坛的问题第22-23页
     ·基于网页分块的爬行策略第23页
   ·本章小结第23-24页
第3章 论坛页面分块算法的研究第24-38页
   ·引言第24页
   ·基于论坛页面结构的垂直分块算法第24-34页
     ·页面分块的术语第24-25页
     ·构建论坛网页XML文档树第25-28页
     ·基于启发式信息的页面分块算法第28页
     ·基于边与边层次的XML元素相似度的形式化第28-33页
     ·基于元素相似度的图划分聚类算法第33页
     ·基于位置的垂直分块算法第33-34页
   ·实验及结果分析第34-37页
     ·性能评价方法第35页
     ·实验结果分析第35-37页
   ·本章小结第37-38页
第4章 基于页面分块的论坛爬行策略第38-47页
   ·引言第38页
   ·基于页面分块的论坛爬行策略第38-42页
     ·信息量的形式化第39页
     ·链接块的筛选算法第39-40页
     ·页面翻页导航技术第40-41页
     ·基于页面分块的论坛爬行算法第41-42页
   ·实验及结果分析第42-46页
     ·爬虫陷阱现象第42页
     ·性能评价方法第42-43页
     ·实验结果分析第43-46页
   ·本章小结第46-47页
第5章 论坛爬虫系统的设计与实现第47-53页
   ·引言第47页
   ·系统的设计目标第47页
   ·系统的体系结构和功能模块设计第47-51页
     ·系统的体系结构第47-48页
     ·系统功能模块详细设计第48-51页
   ·论坛爬虫系统应用第51页
   ·本章小结第51-53页
结论第53-55页
参考文献第55-60页
致谢第60页

论文共60页,点击 下载论文
上一篇:基于角色的访问控制技术的优化和系统设计
下一篇:基于体裁的金融网页自动分类方法