首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于归纳学习的Web半结构化信息抽取

摘要第1-6页
ABSTRACT第6-9页
第一章 绪论第9-14页
   ·研究背景第9-10页
   ·研究目的及意义第10-12页
   ·本文研究内容第12-13页
   ·论文组织安排第13页
   ·本章小结第13-14页
第二章 信息抽取概述第14-21页
   ·Web信息抽取的发展历史第14-15页
   ·Web信息抽取的任务第15页
   ·Web信息抽取技术分类第15-19页
     ·基于HTML结构的方式第16页
     ·基于自然语言处理的方式第16-17页
     ·包装器归纳方式第17-18页
     ·基于Ontology的方式第18-19页
   ·信息抽取评价标准第19-20页
   ·半结构化数据及XML技术应用第20页
   ·本章小结第20-21页
第三章 XML技术综述第21-33页
   ·XML的特点第21-23页
   ·XML的文档结构第23-24页
   ·XML的相关技术规范第24-31页
     ·文档类型定义DTD(Document Type Definition)第24-25页
     ·XML Schema模式第25-26页
     ·文档对象模型DOM第26-27页
     ·XPATH路径定位第27-29页
     ·XSL模板转换第29-31页
   ·XML应用现状第31-32页
   ·本章小结第32-33页
第四章 基于归纳学习的Web信息抽取系统设计与实现第33-51页
   ·设计目标与思路第33-36页
     ·系统目标第33页
     ·基本思路第33-34页
     ·XML和XSLT在系统中的角色第34-35页
     ·数据导向型页面第35-36页
   ·系统的总体框架第36-37页
   ·页面优化模块第37-40页
     ·清洗页面文档第38-40页
     ·页面解析第40页
   ·信息抽取模块第40-50页
     ·规则学习的依据第41-42页
     ·规则学习的步骤第42-49页
     ·Web信息抽取结果第49-50页
   ·本章小结第50-51页
第五章 抽取规则优化算法研究第51-56页
   ·优化的原因第51页
   ·优化的定位方法第51-55页
     ·路径与内容相结合第51-53页
     ·完全基于文本的方法第53-54页
     ·综合比较第54-55页
   ·本章小结第55-56页
第六章 图形用户接口的实现第56-68页
   ·界面绘图技术第56-60页
     ·GUI的主要特征及发展方向第56-57页
     ·MFC界面绘图技术简介第57-58页
     ·MFC界面绘图技术分析第58-60页
   ·系统完整效果及分析第60-67页
     ·实验系统框架设计第60-62页
     ·抽取过程示意及结果分析第62-67页
   ·本章小结第67-68页
第七章 总结与展望第68-69页
参考文献第69-71页
在研成果第71-72页
致谢第72页

论文共72页,点击 下载论文
上一篇:基于加权模糊推理的大学生心理咨询专家系统的研究
下一篇:视频搜索引擎中的文本抽取系统的设计与实现