装备发展战略研究信息化平台中汉语文本信息提取技术的研究

摘要	第1-5页
ABSTRACT	第5-9页
第一章绪论	第9-14页
·研究背景	第9-10页
·国内外研究现状	第10-12页
·本文研究的主要内容与论文结构	第12-14页
·本文研究的主要内容	第12-13页
·论文结构	第13-14页
第二章装备发展战略研究信息化平台与信息提取	第14-18页
·装备发展战略研究信息化平台的体系结构	第14-15页
·信息提取技术介绍	第15-18页
第三章基于统计的命名实体发现方法	第18-35页
·文本统计分析方法简介	第18-21页
·统计方法的理论基础	第18-19页
·N-gram统计方法	第19-20页
·自增长模式统计方法	第20-21页
·统计和词性相结合的命名实体发现方法概述	第21-22页
·文本预处理	第22-26页
·特征字的选取	第23页
·规则库的描述格式	第23-24页
·基于规则的特征字触发切分算法介绍	第24-25页
·实验结果	第25-26页
·改进后的自增长模式统计方法	第26-32页
·汉字自增长模式生成算法	第26-28页
·自增长模式的特点分析	第28-31页
·自增长模式的筛选	第31-32页
·加入消减处理的N-gram统计方法	第32-35页
·1-gram项和2-gram项的生成	第32-33页
·3-gram项的生成及2-gram项的消减	第33页
·4-gram项的生成及3-gram项的消减	第33-34页
·实验结果	第34-35页
第四章基于规则的文本结构化方法	第35-41页
·基于规则的文本结构化方法概述	第35-37页
·规则的获取	第37页
·规则库的结构	第37-39页
·文本结构化处理方法	第39-40页
·实验结果	第40-41页
第五章信息提取子系统的设计与实现	第41-46页
·信息提取子系统的设计	第41-44页
·装备发展战略研究信息化平台的设计	第41-42页
·信息提取子系统的设计	第42页
·系统的界面设计	第42-43页
·算法设计	第43-44页
·信息提取子系统的实现	第44-46页
第六章结论	第46-48页
·本文的主要工作	第46页
·今后的工作	第46-48页
致谢	第48-49页
参考文献表	第49-51页
附录1 自增长模式的模板集(3-8字)	第51-52页
附录2 北大汉语文本词性标注标记集	第52-54页
附录3 作者发表的论文	第54页