首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于包装器模型的信息抽取算法研究

摘要第1-5页
ABSTRACT第5-8页
第一章 绪论第8-12页
   ·信息抽取概述第8-10页
     ·什么是信息抽取第8页
     ·信息抽取系统的评价第8-9页
     ·国内外研究现状第9-10页
     ·信息抽取的研究意义第10页
   ·信息抽取系统的两大设计方法第10-11页
   ·本文的主要工作第11-12页
     ·本文的研究内容第11页
     ·本文的组织第11-12页
第二章 Web信息抽取技术分类对比第12-18页
   ·按照抽取技术路线的分类第12-15页
     ·基于包装器开发语言的抽取技术第12页
     ·基于HTML 树结构的抽取技术第12-13页
     ·基于自然语言处理的抽取技术第13页
     ·基于包装器归纳的抽取技术第13-14页
     ·基于模型的抽取技术第14-15页
     ·基于本体的抽取技术第15页
   ·按照抽取自动化程度的分类第15-18页
     ·手工式Web 信息抽取第15-16页
     ·有监督的Web 信息抽取第16页
     ·半监督的Web 信息抽取第16页
     ·无监督的Web 信息抽取第16-18页
第三章 基于视觉的DOM 树去噪方法研究第18-28页
   ·相关概念第18-20页
     ·数据类型及其实例第18-19页
     ·页面创建模型第19页
     ·包装器生成第19页
     ·Union-free 正则表达式第19-20页
   ·HTML 解析器第20-22页
     ·清洗页面文档第20-21页
     ·页面解析第21-22页
   ·页面去噪算法设计第22-24页
     ·基于DOM 的页面噪声去除方法第22页
     ·基于信息块的去噪方法第22-23页
     ·基于视觉的DOM 树去噪方法第23-24页
   ·相关工作第24页
   ·实验第24-28页
     ·实验设置第25页
     ·结果分析第25-28页
第四章 Web 页面模式发现与包装器生成第28-41页
   ·页面词法分析第28-29页
   ·页面树匹配算法第29-40页
     ·页面树匹配算法介绍第31-33页
     ·页面树匹配算法实现过程第33-39页
     ·抽象有序树第39-40页
   ·包装器生成第40页
   ·相关工作第40-41页
第五章 结论与展望第41-42页
   ·总结第41页
   ·下一步工作第41-42页
参考文献第42-45页
附录A 模板生成系统界面第45-46页
附录B 模板生成系统转化结果第46-47页
致谢第47-48页
作者在读期间的研究成果第48页

论文共48页,点击 下载论文
上一篇:遮挡情况下基于特征相关匹配的目标跟踪方法研究
下一篇:基于本体和潜在语义索引算法的文本分类方法研究