中文摘要 | 第1-4页 |
英文摘要 | 第4-7页 |
第一章 引言 | 第7-10页 |
1.1 课题介绍 | 第7-8页 |
1.2 国外研究现状 | 第8页 |
1.3 本课题与信息提取技术,以及其它相关技术、理论 | 第8-9页 |
1.4 本课题研究的意义 | 第9-10页 |
第二章 当前信息提取技术的研究情况综述 | 第10-28页 |
2.1 关于信息提取技术的一般性介绍 | 第10-12页 |
2.1.1 基本概念 | 第10-11页 |
2.1.2 基本原理和技术 | 第11页 |
2.1.3 评估方法 | 第11-12页 |
2.2 一般信息提取系统的结构构成和处理流程 | 第12-16页 |
2.2.1 一般信息提取系统的结构构成 | 第12-14页 |
2.2.1.1 一般信息提取系统的数据结构构成 | 第12-13页 |
2.2.1.2 信息提取系统处理模块的构成 | 第13-14页 |
2.2.2 一般信息提取系统的处理流程 | 第14-15页 |
2.2.3 处理模块结构,数据模块结构,处理流程之间的综合关系 | 第15-16页 |
2.3 构建信息提取系统的各种方法 | 第16-24页 |
2.3.1 模式获取的主要方式 | 第16-17页 |
2.3.2 概念学习系统CRYSTAL | 第17-21页 |
2.3.2.1 概念的表述 | 第17-18页 |
2.3.2.2 CRYSTAL的概念归纳算法 | 第18-21页 |
2.3.2.3 CRYSTAL算法与机器学习 | 第21页 |
2.3.3 语法分析的深度 | 第21-22页 |
2.3.4 各种不同方法的对比 | 第22-24页 |
2.3.4.1 不同获取模式方法之间的比较 | 第22-23页 |
2.3.4.2 不同语法分析层次之间的比较 | 第23-24页 |
2.4 一个实际的信息抽取系统 | 第24-26页 |
2.4.1 系统的模块构成 | 第24-25页 |
2.4.2 系统处理流程 | 第25-26页 |
2.5 存在的问题和难点 | 第26-28页 |
第三章 面向百科词典的人机结合知识提取系统ENCYLIB的设计实现 | 第28-57页 |
3.1 本系统的特点 | 第28-29页 |
3.1.1 知识提取与信息提取的不同之处 | 第28页 |
3.1.2 基于百科词典的知识提取的特点 | 第28-29页 |
3.2 系统概况 | 第29-33页 |
3.2.1 词典的选择及其文本的情况 | 第29-31页 |
3.2.2 系统的功能设计 | 第31-33页 |
3.2.3 实现方法 | 第33页 |
3.3 系统的处理流程和模块构成 | 第33-57页 |
3.3.1 词条自动分类 | 第33-39页 |
3.3.1.1 分词系统中专名识别方法介绍 | 第34-37页 |
3.3.1.1.1 汉族人名的内部构成 | 第35-36页 |
3.3.1.1.2 人名的上下文语境 | 第36页 |
3.3.1.1.3 人名的动态归并 | 第36页 |
3.3.1.1.4 其它类型的专名识别 | 第36-37页 |
3.3.1.2 分词系统中专名识别功能在词条分类中的应用 | 第37-39页 |
3.3.2 人物、地名条目中知识获取 | 第39-54页 |
3.3.2.1 模式规则的形式与解释 | 第41-45页 |
3.3.2.2 《美术》卷目中西方美术家词条中相关信息的模式规则 | 第45-49页 |
3.3.2.3 《中国地理》卷目中行政地名词条中相关信息的模式规则 | 第49-52页 |
3.3.2.4 模式规则小结 | 第52-53页 |
3.3.2.5 特征词汇的标注 | 第53-54页 |
3.3.3 查询模块 | 第54-57页 |
3.3.3.1 《中国地理》知识查询接口 | 第54-55页 |
3.3.3.2 《美术》卷目知识查询 | 第55-57页 |
第四章 实验结果和分析 | 第57-62页 |
4.1 《中国地理》卷目行政地名词条实验结果及分析 | 第57-59页 |
4.2 《美术》卷目中西方美术家人名词条实验结果及分析 | 第59-62页 |
第五章 今后的工作 | 第62-64页 |
5.1 抽取方法的改进 | 第62页 |
5.2 处理范围的扩展 | 第62-63页 |
5.3 对抽取结果的进一步加工 | 第63页 |
5.4 查询系统的改善 | 第63-64页 |
致 谢 | 第64-65页 |
[参考文献] | 第65页 |