首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于树自动机技术的Web信息抽取研究

摘要第1-7页
Abstract第7-8页
第一章 绪论第8-11页
   ·研究背景第8-9页
   ·本文的主要内容第9页
   ·论文的组织第9-11页
第二章 相关技术分析第11-24页
   ·Web信息抽取技术第11-14页
     ·信息抽取技术发展及国内外研究现状第11-12页
     ·Web信息抽取技术分类第12-13页
     ·信息抽取评价指标第13-14页
   ·自动机技术第14-19页
     ·自动机的基本定义第14-16页
     ·正则表达式向自动机的转换第16-17页
     ·树自动机第17-19页
   ·文法推理第19-21页
     ·正则文法推理第20页
     ·树型文法推理第20页
     ·文法推理与信息抽取第20-21页
   ·两种Web文档第21-23页
     ·HTML第21-22页
     ·XML第22-23页
   ·本章小结第23-24页
第三章 基于树自动机技术的Web信息抽取研究第24-49页
   ·基于树自动机技术的Web信息抽取第24-32页
     ·基于字符串的信息抽取与基于树结构的信息抽取第24-26页
     ·将树自动机技术应用到信息抽取当中要解决的问题及解决方法第26-30页
     ·学习过程与抽取过程第30-32页
   ·使用有秩树自动机的Web信息抽取第32-34页
     ·构造有秩树第32-33页
     ·相关定义第33页
     ·k-testable有秩树自动机推理算法第33-34页
   ·使用无秩树自动机的Web信息抽取第34-46页
     ·无秩树自动机推理算法思想与相关知识第35-38页
     ·KLH树型语言第38-41页
     ·KLH无秩树自动机推理算法第41-45页
     ·由无秩树自动机生成包装器第45-46页
   ·采用有秩树自动机的方法与采用无秩树自动机的方法比较分析第46-48页
   ·本章小结第48-49页
第四章 基于树自动机技术的Web信息抽取系统的设计第49-67页
   ·系统总体设计第49-52页
     ·总体设计目标第49页
     ·系统中信息表示模型的选取第49页
     ·系统总体设计思想第49-51页
     ·系统框架结构第51-52页
   ·各模块设计详解第52-61页
     ·Web文档准备阶段第52-56页
     ·包装器生成阶段第56-58页
     ·Web文档信息抽取阶段第58-59页
     ·信息处理阶段第59-61页
   ·实验与结果分析第61-65页
     ·实验环境第61页
     ·实验数据源第61-62页
     ·实验结果与分析第62-65页
   ·本章小结第65-67页
第五章 总结与展望第67-69页
参考文献第69-72页
作者简历 攻读硕士学位期间完成的主要工作第72-73页
致谢第73页

论文共73页,点击 下载论文
上一篇:基于数字水印的关系数据库版权保护及完整性验证研究
下一篇:基于虚拟存储的容灾数据备份关键技术研究