基于本体的Web数据抽取Wrapper研究与实现
摘要 | 第1-7页 |
ABSTRACT | 第7-9页 |
目录 | 第9-11页 |
第一章 引言 | 第11-16页 |
·研究背景 | 第11-12页 |
·本文工作及论文结构 | 第12-16页 |
·论文工作 | 第12-14页 |
·论文组织结构 | 第14-16页 |
第二章 Web 包装器及其相关技术研究 | 第16-32页 |
·Web 包装器 | 第16-24页 |
·包装器的抽取模型 | 第16-17页 |
·Web Wrapper 相关技术 | 第17-23页 |
·构造基于本体的包装器 | 第23-24页 |
·本体 | 第24-30页 |
·本体的定义 | 第24-25页 |
·本体的描述 | 第25-26页 |
·本体构构建方法与工具 | 第26-28页 |
·运用 Prot(?)g(?)-OWL 建立本体 | 第28-30页 |
·基于本体的包装器模型 | 第30-32页 |
第三章 基于本体的 Wrapper 技术 | 第32-43页 |
·领域本体的构建 | 第32-34页 |
·定义本体的领域和应用范围 | 第32-33页 |
·定义本体的类和层次结构 | 第33-34页 |
·定义本体的属性和个体 | 第34页 |
·基于本体的包装器 | 第34-41页 |
·抽取本体 | 第35页 |
·网页文本值抽取 | 第35-39页 |
·无结构页面向语义 Web 页面文件转换 | 第39-41页 |
·Jena 推理的应用 | 第41-43页 |
第四章 Web 包装器的工作过程 | 第43-48页 |
·包装器的体系结构 | 第43-44页 |
·抽取过程 | 第44-48页 |
·解析查询语句 | 第44页 |
·格式化查询 | 第44-46页 |
·执行查询 | 第46-48页 |
第五章 OBW 系统原型实现 | 第48-60页 |
·Web 数据抽取 | 第48-51页 |
·Web 数据抽取基本概念 | 第48-49页 |
·Web 数据抽取系统的基本结构 | 第49-51页 |
·WebSPHINX 介绍 | 第51-55页 |
·Web 有向图式采集 | 第52-53页 |
·分类器:可重用的采集组件 | 第53-55页 |
·系统设计 | 第55-60页 |
·系统模型架构与工作流程 | 第55-56页 |
·OBW 实验系统总体设计 | 第56-57页 |
·系统运行 | 第57-60页 |
第六章 结论与展望 | 第60-62页 |
·本文结论 | 第60-61页 |
·今后工作 | 第61-62页 |
参考文献 | 第62-66页 |
附录:攻读硕士学位期间发表论文 | 第66-67页 |
致谢 | 第67页 |