首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于百科词典的知识获取系统的研究与实现

中文摘要第1-4页
英文摘要第4-7页
第一章 引言第7-10页
 1.1 课题介绍第7-8页
 1.2 国外研究现状第8页
 1.3 本课题与信息提取技术,以及其它相关技术、理论第8-9页
 1.4 本课题研究的意义第9-10页
第二章 当前信息提取技术的研究情况综述第10-28页
 2.1 关于信息提取技术的一般性介绍第10-12页
  2.1.1 基本概念第10-11页
  2.1.2 基本原理和技术第11页
  2.1.3 评估方法第11-12页
 2.2 一般信息提取系统的结构构成和处理流程第12-16页
  2.2.1 一般信息提取系统的结构构成第12-14页
   2.2.1.1 一般信息提取系统的数据结构构成第12-13页
   2.2.1.2 信息提取系统处理模块的构成第13-14页
  2.2.2 一般信息提取系统的处理流程第14-15页
  2.2.3 处理模块结构,数据模块结构,处理流程之间的综合关系第15-16页
 2.3 构建信息提取系统的各种方法第16-24页
  2.3.1 模式获取的主要方式第16-17页
  2.3.2 概念学习系统CRYSTAL第17-21页
   2.3.2.1 概念的表述第17-18页
   2.3.2.2 CRYSTAL的概念归纳算法第18-21页
   2.3.2.3 CRYSTAL算法与机器学习第21页
  2.3.3 语法分析的深度第21-22页
  2.3.4 各种不同方法的对比第22-24页
   2.3.4.1 不同获取模式方法之间的比较第22-23页
   2.3.4.2 不同语法分析层次之间的比较第23-24页
 2.4 一个实际的信息抽取系统第24-26页
  2.4.1 系统的模块构成第24-25页
  2.4.2 系统处理流程第25-26页
 2.5 存在的问题和难点第26-28页
第三章 面向百科词典的人机结合知识提取系统ENCYLIB的设计实现第28-57页
 3.1 本系统的特点第28-29页
  3.1.1 知识提取与信息提取的不同之处第28页
  3.1.2 基于百科词典的知识提取的特点第28-29页
 3.2 系统概况第29-33页
  3.2.1 词典的选择及其文本的情况第29-31页
  3.2.2 系统的功能设计第31-33页
  3.2.3 实现方法第33页
 3.3 系统的处理流程和模块构成第33-57页
  3.3.1 词条自动分类第33-39页
   3.3.1.1 分词系统中专名识别方法介绍第34-37页
    3.3.1.1.1 汉族人名的内部构成第35-36页
    3.3.1.1.2 人名的上下文语境第36页
    3.3.1.1.3 人名的动态归并第36页
    3.3.1.1.4 其它类型的专名识别第36-37页
   3.3.1.2 分词系统中专名识别功能在词条分类中的应用第37-39页
  3.3.2 人物、地名条目中知识获取第39-54页
   3.3.2.1 模式规则的形式与解释第41-45页
   3.3.2.2 《美术》卷目中西方美术家词条中相关信息的模式规则第45-49页
   3.3.2.3 《中国地理》卷目中行政地名词条中相关信息的模式规则第49-52页
   3.3.2.4 模式规则小结第52-53页
   3.3.2.5 特征词汇的标注第53-54页
  3.3.3 查询模块第54-57页
   3.3.3.1 《中国地理》知识查询接口第54-55页
   3.3.3.2 《美术》卷目知识查询第55-57页
第四章 实验结果和分析第57-62页
 4.1 《中国地理》卷目行政地名词条实验结果及分析第57-59页
 4.2 《美术》卷目中西方美术家人名词条实验结果及分析第59-62页
第五章 今后的工作第62-64页
 5.1 抽取方法的改进第62页
 5.2 处理范围的扩展第62-63页
 5.3 对抽取结果的进一步加工第63页
 5.4 查询系统的改善第63-64页
致  谢第64-65页
[参考文献]第65页

论文共65页,点击 下载论文
上一篇:基于知识库的中文网络检索工具——经济信息智能搜索引擎研究
下一篇:智能搜索引擎中的同义词识别算法研究