首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

实时垂直搜索引擎数据抓取调度研究

摘要第1-4页
Abstract第4-10页
第1章 绪论第10-17页
   ·垂直搜索引擎技术介绍第10页
   ·实时垂直搜索引擎的发展及架构第10-11页
   ·实时垂直搜索引擎相关技术第11-16页
     ·Deep web的发现与集成技术第12-13页
     ·抓取任务调度技术第13页
     ·结构化页面的分析提取技术第13-14页
     ·数据清洗技术以及数据判重技术第14-15页
     ·索引技术第15-16页
   ·本文组织第16页
   ·本章小结第16-17页
第2章 实时垂直搜索抓取调度相关工作第17-27页
   ·网页排序和对象排序相关工作第17-19页
     ·网页排序研究相关工作第17-18页
     ·对象排序研究相关工作第18-19页
   ·网页变化规律研究相关工作第19-20页
   ·数据新鲜程度研究相关工作第20-25页
     ·数据新鲜程度衡量标准第21页
     ·实时垂直搜索引擎数据新鲜度衡量方法第21-25页
   ·现有工作的不足与改进思路第25-26页
   ·本文的研究思路第26页
   ·本章小结第26-27页
第3章 实时垂直搜索引擎抓取策略第27-37页
   ·宏观条件下的数据抓取更新基本策略第27-33页
     ·数据抓取策略第27-28页
     ·数据更新策略第28-30页
     ·数据重抓频率第30-31页
     ·数据更新顺寻第31-32页
     ·实时垂直搜索引擎的数据更新模式第32-33页
   ·数据对象变化规律估算方法第33-36页
     ·数据对象变化规律预测基本问题第33-35页
     ·实时搜索引擎数据对象变化规律预测方法第35-36页
   ·本章小结第36-37页
第4章 实时垂直搜索引擎分发策略第37-47页
   ·基于对象关联的热门预测模型第38-39页
     ·基于对象关联的热门预测模型原理第38页
     ·基于对象关联的热门预测模型的改进第38-39页
   ·资源分配及自动平衡策略第39-45页
     ·用户查询规律分析第39-41页
     ·数据变化频率预测第41页
     ·抓取资源的初始分配策略第41-43页
     ·抓取资源动态平衡策略第43-45页
     ·资源分配及平衡算法性能分析第45页
   ·本章小结第45-47页
第5章 自适应的实时垂直搜索引擎抓取分发架构第47-60页
   ·实时垂直搜索引擎整体体系结构的改变第47-51页
     ·垂直搜索引擎整体模块划分第47-49页
     ·传统垂直搜索引擎任务分发模块的缺点第49-50页
     ·实时垂直搜索搜索引擎整体架构第50-51页
   ·SACD模型:自适应的实时垂直搜索引擎抓取分发模型第51-59页
     ·SACD模型整体架构第52页
     ·SACD模型各模块介绍第52-57页
     ·SACD模型的自适应性第57-58页
     ·SACD模型的优点第58-59页
   ·本章小结第59-60页
第6章 测试和实验第60-66页
   ·数据变化规律验证第60-61页
   ·基于对象关联的热门预测模型准确性第61-62页
   ·资源分配平衡算法准确性第62-64页
   ·算法性能对比第64-65页
   ·本章小结第65-66页
第7章 总结与展望第66-68页
   ·本文主要的工作第66页
   ·本文的贡献和创新点第66-67页
   ·下一步研究工作第67-68页
参考文献第68-72页
攻读硕士学位期间主要的研究成果第72-73页
致谢第73页

论文共73页,点击 下载论文
上一篇:PBE框架下报表生成及发布系统的设计与实现
下一篇:支持360度立体高分辨率投影显示的绘制系统