首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于语义的Web信息抽取技术研究

摘要第1-6页
Abstract第6-11页
第1章 绪论第11-16页
   ·选题背景及意义第11-12页
   ·信息抽取技术的研究现状第12-14页
   ·本文研究内容第14-15页
   ·论文结构第15-16页
第2章 相关工作基础第16-28页
   ·Web信息抽取技术概述第16-21页
     ·Web信息抽取技术第16-18页
     ·现有Web信息抽取方法的技术路线分析与比较第18-21页
     ·本文的Web信息抽取方法第21页
   ·XML相关技术第21-24页
     ·XML基础知识介绍第21-22页
     ·XML在信息抽取系统中的优势及其应用第22-24页
   ·本体技术第24-27页
     ·本体基础知识介绍第24-27页
     ·使用本体的优势第27页
   ·本章小结第27-28页
第3章 基于语义的Web信息抽取系统的设计第28-43页
   ·系统的框架模型结构第28-30页
   ·文档解析第30-31页
   ·模式提取第31页
   ·基于语义的本体建立方法第31-36页
     ·本体定义方法第31-33页
     ·基于术语语义聚类生成概念的方法第33-34页
     ·概念关系的建立第34-35页
     ·本体学习与领域本体的构建第35-36页
   ·基于OWL描述本体的语义信息抽取第36-42页
     ·基于本体的抽取规则的生成第36-39页
     ·关系数据库的创建第39-40页
     ·具有语义信息的RDF数据模型的生成第40-42页
   ·本章小结第42-43页
第4章 基于栈与链式结构的HTML到XML转换算法第43-52页
   ·问题描述第43-44页
   ·HTML到XML的转换原理与步骤第44-48页
     ·现有的转换系统和算法第44-46页
     ·HTML和XML格式比较第46-47页
     ·转换原理与步骤第47-48页
   ·HTML到XML转换算法第48-51页
     ·解析HTML文档为二叉链表结构第48-49页
     ·消除HTML的不严格语法第49-50页
     ·XML文档的输出第50-51页
   ·本章小结第51-52页
第5章 基于SuffixTree的数据模式提取算法研究第52-66页
   ·模式提取的方法介绍第52-54页
   ·样本文档的Suffix Tree解析第54-61页
     ·Suffix Tree的定义第55-56页
     ·Suffix Tree的构造方法第56-59页
     ·样本文档解析举例第59-61页
   ·备选数据模式集的生成第61-63页
     ·相关定义第61-62页
     ·备选数据模式集的生成算法第62-63页
   ·有效数据模式提取算法第63-65页
     ·有效模式提取的依据第63-64页
     ·有效数据模式提取算法第64-65页
   ·本章小结第65-66页
第6章 实例验证与分析第66-75页
   ·样本页面的获取及处理第66-67页
   ·Suffix Tree编码实现第67-69页
   ·构造领域本体第69-71页
   ·抽取Web信息第71-73页
   ·实验结果及分析第73-74页
   ·本章小结第74-75页
结论第75-77页
参考文献第77-83页
攻读硕士学位期间发表的论文和取得的科研成果第83-84页
致谢第84页

论文共84页,点击 下载论文
上一篇:基于领域知识的数据库模式匹配技术研究
下一篇:自律可信系统模型及评价研究