首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Deep Web数据抽取及集成技术研究

中文摘要第1-4页
Abstract第4-10页
第1章 绪论第10-16页
   ·问题的提出第10-11页
   ·国内外研究现状第11-13页
   ·本文的特色与贡献第13-14页
   ·本文的结构安排第14-16页
第2章 Web数据对象抽取第16-26页
   ·概述第16-17页
     ·信息抽取技术的发展历程第16-17页
     ·信息抽取技术的分类第17页
   ·Web数据对象抽取的定义第17-19页
   ·基于DOM的Web数据对象自动抽取方法第19-25页
     ·页面预处理第19-20页
     ·结构相似度第20-23页
     ·内容相似度第23-25页
   ·本章小结第25-26页
第3章 Web数据对象集成第26-40页
   ·概述第26-28页
     ·集成问题分析第26-27页
     ·相关工作第27-28页
   ·问题描述第28-30页
     ·Web数据对象模式异构的表现形式第28-30页
     ·Web数据对象的冗余现象第30页
   ·Web数据对象的集成方法第30-39页
     ·Web数据对象模式的规范化第30-36页
       ·基本思想第31-32页
       ·相似度的计算第32-33页
       ·模式的规范化过程第33-36页
     ·Web数据对象的去重处理第36-39页
       ·计算属性的区分度第36-38页
       ·Web数据对象去重第38-39页
   ·本章小结第39-40页
第4章 海量Web数据对象的组织第40-52页
   ·概述第40-43页
     ·问题分析第40-41页
     ·相关工作第41-43页
   ·基于增量层次聚类思想的数据组织方法第43-51页
     ·基本原理第43-44页
     ·点的定义第44-45页
     ·中心点的计算第45-47页
     ·根结点的形成第47页
     ·相似度的计算第47-49页
     ·增量层次聚类第49-51页
   ·本章小结第51-52页
第5章 面向Deep Web的搜索引擎原型系统设计第52-65页
   ·系统背景第52-53页
     ·Deep Web的规模第52-53页
     ·传统搜索引擎在Deep Web领域中的不足第53页
   ·系统架构及工作流程设计第53-55页
   ·系统模块设计第55-63页
     ·Deep Web聚焦爬虫第55-57页
     ·Web数据对象抽取子系统第57-59页
       ·系统结构第57-58页
       ·工作流程第58-59页
     ·Web数据对象集成子系统第59-61页
       ·系统结构第59页
       ·工作流程第59-61页
     ·分词器第61-62页
     ·索引管理器第62页
     ·查询处理器第62-63页
     ·结果处理器第63页
   ·本章小结第63-65页
第6章 实验结果及分析第65-74页
   ·Web数据对象自动抽取实验第65-69页
     ·测试数据集第65页
     ·评价方法第65-67页
     ·实验结果及分析第67-69页
   ·Web数据对象集成实验第69-73页
     ·测试数据第69页
     ·评价方法第69-70页
     ·实验结果及分析第70-73页
   ·海量Web数据对象的组织实验第73页
   ·本章小结第73-74页
第7章 总结与展望第74-77页
   ·工作总结第74-75页
   ·展望未来第75-77页
参考文献第77-83页
攻读学位期间公开发表的论文与参与的科研项目第83-84页
致谢第84-85页
详细摘要第85-87页

论文共87页,点击 下载论文
上一篇:Deep Web数据源质量估计模型及应用研究
下一篇:基于IPv4/IPv6双协议栈的联动防御系统研究与设计