首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于RSS的自适应抓取服务的研究与实现

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-14页
   ·研究背景第10-11页
   ·课题的提出第11-12页
   ·论文组织结构第12-14页
第2章 相关技术第14-28页
   ·XML技术第14-17页
     ·XML概念第14-15页
     ·XML的文档结构第15-16页
     ·XML文档的处理技术第16-17页
   ·RSS简介第17-21页
     ·RSS概念及历史第17-18页
     ·RSS技术的基本原理第18-19页
     ·RSS的文档结构第19-20页
     ·RSS的发展及现状第20-21页
   ·搜索引擎简介第21-25页
     ·搜索引擎概念和分类第21-22页
     ·Web爬虫第22-23页
     ·RSS搜索引擎概念第23-24页
     ·RSS搜索引擎与普通搜索引擎的区别第24-25页
     ·RSS搜索引擎的意义第25页
   ·Web Services简介第25-27页
     ·Web服务架构第26-27页
     ·Web服务的应用对象第27页
   ·小结第27-28页
第3章 自适应抓取间隔算法第28-42页
   ·RSS文件链接的识别算法第28-29页
   ·文章去重算法第29-32页
     ·文章签名算法第30-31页
     ·文章去重算法第31-32页
   ·自适应抓取间隔算法第32-41页
     ·设计自适应抓取间隔算法的必要性第33-34页
     ·自适应抓取间隔算法影响因素第34-36页
     ·初始抓取间隔的确定第36-37页
     ·抓取间隔内有更新的情况第37-39页
     ·抓取间隔内没有更新的情况第39-40页
     ·参数选择第40-41页
   ·小结第41-42页
第4章 自适应抓取服务总体设计第42-56页
   ·系统总体设计第42-43页
   ·系统功能设计第43-55页
     ·服务接口第43-45页
     ·RSS收集模块第45-48页
     ·控制器第48-49页
     ·自适应抓取模块第49-53页
     ·新增结果分发模块第53-55页
   ·小结第55-56页
第5章 系统实验及结果分析第56-70页
   ·系统实现环境第56页
   ·RSS收集模块第56-58页
   ·RSS内容抽取和生成过程第58-60页
   ·控制器第60-61页
   ·自适应抓取模块第61-62页
   ·自适应的抓取间隔算法结果分析第62-68页
     ·定义平均抓取延迟和平均更新间隔第62-63页
     ·参数选择第63页
     ·与等间隔抓取算法效果比较第63-68页
   ·客户端接收结果第68页
   ·小结第68-70页
第6章 总结与展望第70-72页
   ·研究工作总结第70-71页
   ·研究展望第71-72页
参考文献第72-74页
致谢第74-76页
攻读硕士学位期间发表学术论文情况第76页

论文共76页,点击 下载论文
上一篇:基于改进马尔可夫随机场模型的医学图像分割算法研究
下一篇:面向对象数据模型到OWL DL本体映射方法的研究