首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于RSS的聚焦网络爬虫在高校网站群中的研究

摘要第1-4页
ABSTRACT第4-8页
第1章 绪论第8-11页
   ·课题的研究背景和意义第8-10页
     ·课题背景第8-9页
     ·课题意义第9-10页
   ·本文研究内容及组织结构第10-11页
第2章 聚焦网络爬虫初步研究及RSS技术介绍第11-28页
   ·相关知识介绍第11-14页
     ·URL结构分析第11页
     ·HTML页面分析第11-14页
   ·网络爬虫概述第14页
   ·通用网络爬虫研究第14-18页
     ·通用网络爬虫简介第14-16页
     ·开源网络爬虫实例第16-17页
     ·通用网络爬虫不足第17-18页
   ·聚焦网络爬虫研究第18-20页
   ·RSS技术研究第20-27页
     ·RSS概念和工作原理第21-23页
     ·RSS的发展历史第23-24页
     ·RSS feed文件格式第24-27页
     ·RSS客户端简介第27页
   ·本章小结第27-28页
第3章 基于RSS的聚焦网络爬虫的关键技术研究第28-42页
   ·抓取网页信息技术研究第29-30页
   ·主题网络爬虫爬行策略第30-33页
   ·文本分类算法研究第33-37页
     ·TF-IDF算法第33-34页
     ·TF-IDF算法的改进第34-37页
   ·网络爬虫增量式抓取的研究及改进第37-41页
   ·本章小结第41-42页
第4章 基于RSS的聚焦网络爬虫在高校网站群中的系统的设计与实现第42-62页
   ·系统需求分析第42-43页
   ·系统总体设计第43-45页
   ·系统模块设计及实现第45-61页
     ·聚焦网络爬虫子系统设计及实现第45-60页
     ·RSS推送子系统设计及实现第60-61页
   ·本章小结第61-62页
第5章 系统测试与结果分析第62-69页
   ·系统环境第62页
   ·系统实验结果及分析第62-68页
     ·系统爬虫运行第62-64页
     ·系统爬虫性能分析第64-66页
     ·网页分类准确度分析第66-67页
     ·对发布的RSS文档的订阅测试第67-68页
   ·本章小结第68-69页
第6章 总结与展望第69-71页
   ·工作总结第69页
   ·工作展望第69-71页
致谢第71-72页
参考文献第72-75页
攻读学位期间的研究成果第75页

论文共75页,点击 下载论文
上一篇:基于统一身份认证的权限管理在服务外包平台中的研究
下一篇:中小企业网络设计研究与实现