首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Deep Web数据获取方法研究

中文摘要第1-5页
Abstract第5-10页
第1章 绪论第10-14页
   ·研究背景及意义第10-11页
   ·国内外研究现状第11-12页
   ·主要研究内容第12-13页
   ·本文组织第13-14页
第2章 Deep Web 数据获取概述第14-22页
   ·Deep Web 数据获取相关研究第14-16页
   ·Deep Web 数据获取的重要性第16-17页
   ·Deep Web 数据获取的难点第17-18页
   ·解决方法介绍第18-21页
     ·Deep Web 网站特点分析第18-19页
     ·基于URL 模式的Deep Web 数据获取方法第19-20页
     ·基于关键词查询的方法第20-21页
   ·本章小结第21-22页
第3章 查询接口中有效属性组合的选择第22-32页
   ·属性分类第22-23页
   ·查询接口的特征提取第23-27页
     ·HTML 表单和DOM 树第23-24页
     ·查询接口的特征提取第24-27页
     ·特征的标准化第27页
   ·选择有效的属性组合第27-31页
     ·属性相关度计算第28-30页
     ·基于属性相关度的属性组合有效性计算第30-31页
   ·本章小结第31-32页
第4章 选择有效的查询关键词第32-44页
   ·特定的文本属性第32-34页
   ·普通的文本属性第34-43页
     ·查询候选关键词生成第34-37页
       ·样本网页集聚类和模板生成第34-36页
       ·有效数据字段发现第36页
       ·有效数据字段与属性之间的映射第36-37页
     ·查询关键字选择策略第37-43页
       ·获取Deep Web 数据的形式化定义第38-39页
       ·性能评价标准第39页
       ·估计匹配的页面数量第39-40页
       ·查询选择算法第40-41页
       ·查询效能值计算的统计方法第41-42页
       ·限制结果页面数的站点第42-43页
   ·本章小结第43-44页
第5章 增量获取Deep Web 数据第44-54页
   ·增量采集研究现状第44-46页
     ·网页的增量采集策略第44-45页
     ·网页的增量采集方法第45-46页
   ·相关概念第46-48页
     ·网页库的新鲜度第46页
     ·增量采集的定义第46页
     ·Deep Web 站点的网页更新特点第46-48页
   ·基于泊松模型的增量获取Deep Web 数据的方法第48-53页
     ·基于泊松模型的方法第48-51页
     ·泊松模型在Deep Web 数据获取中的应用第51-52页
     ·增量调度模块第52-53页
   ·本章小结第53-54页
第6章 系统设计与实验第54-62页
   ·系统设计第54-55页
   ·Deep Web 爬虫效果的评价标准第55-56页
   ·实验数据集第56页
   ·实验结果及分析第56-61页
     ·基于属性相关度的属性组合选择的有效性与高效性第56-58页
     ·查询关键词选择的有效性与高效性第58-60页
     ·爬虫在覆盖率和网页库新鲜度方面的有效性第60-61页
   ·本章小结第61-62页
第7章 总结与展望第62-65页
   ·工作总结第62-63页
   ·特点与创新第63页
   ·展望第63-65页
参考文献第65-70页
攻读学位期间公开发表的论文与科研项目第70-71页
致谢第71-72页

论文共72页,点击 下载论文
上一篇:基于主题的事件融合技术的研究与实现
下一篇:时间感知Web服务交互适配技术研究