首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

Web信息抽取系统SEU-WIE设计与实现

摘要第1-5页
ABSTRACT第5-8页
第1章 绪言第8-10页
   ·研究背景第8页
   ·研究现状第8页
   ·本文研究内容及组织结构第8-10页
第2章 系统所涉及的相关技术第10-20页
   ·本体介绍第10-12页
     ·本体的提出第10页
     ·使用本体的优势第10-11页
     ·本体描述语言第11页
     ·运用ontology 的信息抽取概要第11-12页
   ·HTML第12-14页
     ·HTML 语言的发展第12页
     ·HTML 的特点第12-13页
     ·HTML 的局限性第13-14页
   ·XML第14-17页
     ·XML 产生第14页
     ·XML 概述第14-15页
     ·XML 的优越性第15页
     ·XML 的语法结构第15-16页
     ·XML 模式的定义方法第16-17页
   ·DOM 树第17-18页
     ·DOM 定义第17页
     ·DOM 和HTML 树型逻辑结构第17-18页
   ·XPATH第18页
   ·HTTP 协议第18-19页
   ·相关技术在本文中的应用第19-20页
第3章 半结构化网页抽取系统原理第20-26页
   ·信息抽取定义第20页
   ·WEB 信息抽取原理分析第20-23页
     ·基于自然语言处理方式的信息抽取第20-21页
     ·基于包装器归纳方式的信息抽取第21页
     ·基于ONTOLOGY 方式的信息抽取第21-22页
     ·基于HTML 结构的信息抽取第22页
     ·基于Web 查询的信息抽取第22-23页
   ·WEB 信息半结构化特点第23-24页
   ·WRAPPER第24-25页
   ·本文的信息抽取技术特点第25-26页
第4章 SEU-WIE 系统的背景、难点及其架构第26-30页
   ·SEU-WIE 系统的背景简介第26-27页
   ·半结构化WEB 抽取系统SEU-WIE 的难点问题第27页
   ·WEB 信息抽取系统的总体结构体系第27-30页
第5章 半结构化网页抽取系统 SEU-WIE 的抽取流程第30-43页
   ·建立本体第30-32页
   ·WEB 信息抽取规则定义阶段第32-38页
     ·源网页的获取第32-34页
     ·解析网页并且生成DOM 树第34-36页
     ·目的表的模式的获取第36-37页
     ·抽取规则定义第37-38页
   ·WEB 信息抽取实施阶段第38-41页
     ·抽取规则执行第38-39页
     ·抽取规则执行算法第39页
     ·改进的算法第39-41页
   ·系统的抽取结果第41-43页
     ·衡量信息抽取系统的性能指标第41-42页
     ·本系统抽取性能分析第42-43页
第6章 WEB 数据的预处理第43-49页
   ·WEB 数据预处理的必要性第43页
   ·数据预处理第43-48页
     ·数据预处理的框架第43-44页
     ·数据预处理描述第44-46页
     ·数据预处理系统的结构第46-47页
     ·数据预处理的执行第47-48页
   ·小结第48-49页
第7章 总结与展望第49-50页
致谢第50-51页
参考文献第51-54页
附件第54-59页
 附件一第54-57页
 附件二第57-59页

论文共59页,点击 下载论文
上一篇:卫星高度计资料校正及基于连续函数的调和分析方法研究
下一篇:三峡永久船闸砼衬砌墙结构设计与监测