首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于XML的中间文档信息提取技术研究

摘要第1-6页
ABSTRACT第6-7页
第一章引言第7-9页
 1.1 背景第7-8页
 1.2 本文安排第8-9页
第二章 信息提取技术概述第9-14页
 2.1 问题的提出第9-10页
 2.2 信息提取的定义第10-11页
 2.3 信息提取系统实现的两种方法第11-13页
 2.4 信息提取的一般过程第13-14页
第三章 IEML中间文档格式第14-21页
 3.1 背景第14-15页
 3.2 IEML文档的DTD第15-21页
第四章 用IEML文档表示PDF文档第21-37页
 4.1 PDF文档的结构第22-24页
 4.2 从PDF文档到IEML文档的转换算法第24-28页
 4.3 一个PDF文档转换为IEML文档的实例第28-37页
第五章 用IEML文档表示Word文档第37-43页
 5.1 Word文档结构第37-42页
 5.2 从Word文档到IEML文档的转换算法第42-43页
第六章 IEML中间文档用于信息提取第43-48页
 6.1 对中间文档的文本内容特征提取第43-45页
 6.2 论文关键信息提取第45-48页
第七章 结束语第48-50页
 7.1 系统的实现与总结第48页
 7.2 下一步的工作第48-50页
参考文献第50-53页
致谢第53-54页

论文共54页,点击 下载论文
上一篇:运输配送管理信息系统的设计与实现
下一篇:LPS致家兔发热过程中下丘脑HSF1和HSP70的表达与cAMP和PGE2含量的变化