首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

术语自动抽取技术的研究与应用

摘要第1-7页
Abstract第7-11页
第1章 引言第11-16页
   ·选题的背景和意义第11-12页
   ·国内外术语自动抽取研究现状第12-14页
     ·国外术语抽取技术的研究第12-13页
     ·国内术语抽取技术的研究第13-14页
   ·本文的主要工作第14页
   ·本文的组织结构第14-16页
第2章 术语自动抽取概述第16-27页
   ·术语的特点和分类第16-18页
     ·术语的特点第16-17页
     ·术语的分类第17-18页
   ·基于规则的术语抽取方法第18-19页
   ·基于统计的术语抽取方法第19-20页
   ·基于混合策略的术语抽取方法第20-21页
   ·机器学习的理论介绍第21-27页
     ·生成模型和判别模型第21-22页
     ·最大熵模型的介绍第22-24页
     ·条件随机场模型的介绍第24-27页
第3章 基于规则的术语自动抽取技术研究第27-34页
   ·专利语料分析第27-29页
     ·本文术语的界定第27页
     ·专利语料中术语的特点和识别的难点分析第27-29页
   ·基于规则的术语自动抽取的系统框架第29页
   ·系统各模块的介绍第29-32页
     ·预处理第29-30页
     ·停用词库的建立第30-31页
     ·词语的角色标注第31页
     ·后处理第31-32页
   ·实验结果第32-33页
   ·基于统计的术语抽取实验第33页
   ·小结第33-34页
第4章 基于机器学习的术语自动抽取方法研究第34-47页
   ·基于最大熵的术语自动抽取研究第34-37页
     ·预处理第35页
     ·特征选择第35-36页
     ·测试及实验结果第36-37页
   ·基于词的条件随机场的术语自动抽取研究第37-42页
     ·预处理第37页
     ·特征模板选取第37-39页
     ·特征的选择第39页
     ·测试及结果第39-40页
     ·扩展BIO 标注集实验第40-41页
     ·后处理模块第41-42页
   ·基于字的条件随机场的术语自动抽取研究第42-46页
     ·基于词的模型中存在问题第42-44页
     ·基于字的术语抽取实验第44-45页
     ·加入字性的实验第45-46页
   ·小结第46-47页
第5章 系统实现和应用第47-52页
   ·系统框架第47页
   ·实验结果第47-48页
     ·基于字的模型与规则相结合的实验结果第47-48页
     ·实验结果比较第48页
   ·结果分析第48-50页
   ·术语自动抽取的应用第50-51页
   ·小结第51-52页
结论第52-54页
附录I 部分处理规则列表第54页
附录II 部分术语词性规则第54-55页
附录Ⅲ 术语标注界面第55页
附录Ⅳ 术语抽取界面第55-56页
参考文献第56-59页
致谢第59-60页
攻读硕士期间发表(含录用)的学术论文第60页

论文共60页,点击 下载论文
上一篇:复杂系统综合健康管理软件架构的研究
下一篇:影响图理论在风险评估中的应用