基于RSS的自适应抓取服务的研究与实现

摘要	第1-6页
Abstract	第6-10页
第1章绪论	第10-14页
·研究背景	第10-11页
·课题的提出	第11-12页
·论文组织结构	第12-14页
第2章相关技术	第14-28页
·XML技术	第14-17页
·XML概念	第14-15页
·XML的文档结构	第15-16页
·XML文档的处理技术	第16-17页
·RSS简介	第17-21页
·RSS概念及历史	第17-18页
·RSS技术的基本原理	第18-19页
·RSS的文档结构	第19-20页
·RSS的发展及现状	第20-21页
·搜索引擎简介	第21-25页
·搜索引擎概念和分类	第21-22页
·Web爬虫	第22-23页
·RSS搜索引擎概念	第23-24页
·RSS搜索引擎与普通搜索引擎的区别	第24-25页
·RSS搜索引擎的意义	第25页
·Web Services简介	第25-27页
·Web服务架构	第26-27页
·Web服务的应用对象	第27页
·小结	第27-28页
第3章自适应抓取间隔算法	第28-42页
·RSS文件链接的识别算法	第28-29页
·文章去重算法	第29-32页
·文章签名算法	第30-31页
·文章去重算法	第31-32页
·自适应抓取间隔算法	第32-41页
·设计自适应抓取间隔算法的必要性	第33-34页
·自适应抓取间隔算法影响因素	第34-36页
·初始抓取间隔的确定	第36-37页
·抓取间隔内有更新的情况	第37-39页
·抓取间隔内没有更新的情况	第39-40页
·参数选择	第40-41页
·小结	第41-42页
第4章自适应抓取服务总体设计	第42-56页
·系统总体设计	第42-43页
·系统功能设计	第43-55页
·服务接口	第43-45页
·RSS收集模块	第45-48页
·控制器	第48-49页
·自适应抓取模块	第49-53页
·新增结果分发模块	第53-55页
·小结	第55-56页
第5章系统实验及结果分析	第56-70页
·系统实现环境	第56页
·RSS收集模块	第56-58页
·RSS内容抽取和生成过程	第58-60页
·控制器	第60-61页
·自适应抓取模块	第61-62页
·自适应的抓取间隔算法结果分析	第62-68页
·定义平均抓取延迟和平均更新间隔	第62-63页
·参数选择	第63页
·与等间隔抓取算法效果比较	第63-68页
·客户端接收结果	第68页
·小结	第68-70页
第6章总结与展望	第70-72页
·研究工作总结	第70-71页
·研究展望	第71-72页
参考文献	第72-74页
致谢	第74-76页
攻读硕士学位期间发表学术论文情况	第76页