首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于重复模式的Web数据抽取与集成应用

摘要第1-5页
Abstract第5-8页
第1章 引言第8-14页
   ·研究背景第8-10页
     ·互联网搜索引擎第8-9页
     ·从Web数据获取知识面临的挑战第9-10页
   ·研究现状第10-12页
   ·本文研究内容第12-13页
   ·本文组织结构第13-14页
第2章 相关知识第14-29页
   ·HTML第14-18页
     ·HTML语言的发展第14-15页
     ·HTML的语法结构第15-16页
     ·HTML的特点第16页
     ·HTML的局限性第16-18页
   ·XML第18-23页
     ·XML产生第18页
     ·XML概述第18-19页
     ·XML与HTML的不同第19页
     ·XML的特点第19-20页
     ·XML的语法结构第20-22页
     ·XML与传统关系数据库的比较第22-23页
   ·DOM树第23-25页
     ·DOM定义第23-24页
     ·DOM和HTML树型逻辑结构第24-25页
   ·XPath第25-26页
   ·HTTP协议第26-27页
   ·中文分词第27页
   ·相关技术在本文中的应用第27-29页
第3章 基于重复模式的Web数据抽取第29-45页
   ·抽取系统实现目标第29页
   ·系统抽取流程第29-31页
   ·关键技术的研究与实现第31-43页
     ·第31-33页
     ·页面预处理第33-35页
     ·归纳规则第35-42页
     ·规则描述第42-43页
     ·抽取数据第43页
   ·本章小结第43-45页
第4章 Web数据的集成应用第45-54页
   ·集成工具的选择第45-47页
   ·数据的集成第47-53页
   ·本章小结第53-54页
第5章 原型系统介绍与实验分析第54-61页
   ·系统工作模式第54-55页
   ·实验环境第55页
   ·抽取系统系统设计第55-56页
   ·功能模块设计第56-58页
   ·系统评价标准及实验第58-61页
     ·系统评价标准第58-59页
     ·实验结果及分析第59-61页
第6章 总结与展望第61-63页
 1 小结第61-62页
 2 对后续工作的展望第62-63页
参考文献第63-66页
致谢第66页

论文共66页,点击 下载论文
上一篇:基于多维聚类挖掘的异常检测方法研究
下一篇:RoboCup中多智能体协作的研究