首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于XML的Web信息抽取与集成技术的研究

第1章 绪论第1-13页
 1.1 课题研究背景第9页
 1.2 课题研究现状第9-11页
 1.3 本文研究内容及方向第11-13页
第2章 相关技术介绍第13-23页
 2.1 XML技术介绍第13-20页
  2.1.1 XML的特点第13-16页
  2.1.2 XML中间件技术第16-17页
  2.1.3 XML Schema第17-18页
  2.1.4 XML Parser第18-20页
 2.2 现有信息抽取模型第20-23页
  2.2.1 信息抽取模型第20-21页
  2.2.2 规则描述语言第21-23页
第3章 基于 XML的 WEB信息抽取方法分析第23-36页
 3.1 现有的 WEB页面信息抽取的相关方法第23-25页
  3.1.1 手工方式的信息抽取第23-24页
  3.1.2 半自动化的信息抽取第24页
  3.1.3 自动(基于规则)的信息抽取第24-25页
 3.2 基于树型结构的 WEB数据抽取规则第25-30页
  3.2.1 用树型结构表示 Web文档第25-26页
  3.2.2 算法总体思路第26-29页
  3.2.3 抽取数据的XML输出第29-30页
 3.3 基于 DOM的XML数据访问机制第30-36页
  3.3.1 XML数据岛第30-31页
  3.3.2 使用 DOM访问XML文档第31-36页
第4章 XML与关系数据集成方法分析第36-45页
 4.1 XML数据的关系存储第36-40页
  4.1.1 如何建立关系映射第37页
  4.1.2 建立关系映射的相关模型第37-40页
 4.2 基于 XML的 WEB查询处理第40-45页
  4.2.1 现有的XML查询语言第41-43页
  4.2.2 基于 XML的 Web查询模式第43-45页
第5章 信息抽取原型系统的实现第45-54页
 5.1 需求分析第45-47页
  5.1.1 基于规则的自动抽取第45-46页
  5.1.2 基于人工的手动抽取第46页
  5.1.3 系统用例设计及分析第46-47页
 5.2 原型系统总体框架设计第47-51页
  5.2.1 系统功能模块设计第47-48页
  5.2.2 系统体系结构设计第48页
  5.2.3 功能模块的介绍第48-51页
 5.3 原型系统的实现及评价第51-54页
  5.3.1 系统实现环境第51-52页
  5.3.2 原型系统评价策略第52-54页
第6章 结论第54-55页
 6.1 论文总结第54页
 6.2 工作展望第54-55页
参考文献第55-57页
附录 部分模块程序代码第57-59页
攻读学位期间公开发表的论文第59-60页
致谢第60-61页
研究生履历第61页

论文共61页,点击 下载论文
上一篇:单晶硅超精密磨削分子动力学并行仿真的研究
下一篇:电火花微细加工微能脉冲电源模块的研究