首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于半自动化WEB数据抽取器的信息集成研究

摘要第1-6页
ABSTRACT第6-8页
第1章 绪论第8-14页
   ·研究背景及意义第8页
   ·信息集成研究现状第8-12页
     ·异构数据源特点第8-9页
     ·信息集成体系结构第9-11页
     ·信息集成目标第11页
     ·WEB信息集成现状第11-12页
   ·本文主要研究内容第12页
   ·章节安排第12-14页
第2章 信息集成基本原理第14-23页
   ·HTML、XML和XHTML第14-16页
     ·HTML第14页
     ·XML第14-15页
     ·XHTML第15-16页
   ·DOM、XPath和XSLT第16-21页
     ·DOM第16页
     ·XPath第16-18页
     ·XSLT第18-21页
   ·WEB数据抽取技术现状第21-22页
   ·本章小结第22-23页
第3章 信息集成体系结构设计第23-30页
   ·WEB数据源特点第23页
   ·MMIIF设计第23-29页
     ·包装器第24-26页
     ·查询处理过程第26页
     ·模式集成第26-29页
   ·本章小结第29-30页
第4章 半自动化WEB数据抽取器第30-44页
   ·WEB数据抽取难点分析第30页
   ·WEB数据抽取器目标第30-31页
   ·半自动化WEB数据抽取器设计第31-42页
     ·获取相似网页第31-35页
     ·清理页面第35-36页
     ·定义抽取模式第36-39页
     ·抽取数据第39-40页
     ·XML文件导入关系数据库第40-42页
   ·本章小结第42-44页
第5章 半自动化WEB数据抽取器实现及评价第44-55页
   ·半自动化WEB数据抽取器实现第44-51页
     ·采集数据第44页
     ·清理数据第44-45页
     ·生成抽取规则第45-49页
     ·抽取数据第49页
     ·导入数据库第49-51页
   ·数据抽取器评价第51-53页
     ·数据抽取评价指标第51页
     ·数据抽取结果分析第51-53页
   ·本章小结第53-55页
第6章 总结与展望第55-56页
 主要工作第55页
 主要贡献及创新点第55页
 展望第55-56页
参考文献第56-59页
附录第59-60页
致谢第60-61页
在读期间发表的论文第61页

论文共61页,点击 下载论文
上一篇:P2P网络中基于节点状态的激励机制研究
下一篇:西南地区民族中学校园网内容建设及影响因素研究