首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于AdaBoost.MH算法的汉语多义词消歧

摘要第1-5页
Abstract第5-8页
引言第8-11页
1 问题描述第11-21页
   ·词义排歧的提出及其意义第11-13页
     ·词义排歧第11-12页
     ·词义排歧研究的意义第12-13页
   ·国内外的研究状况第13-19页
     ·有指导排歧方法第13-16页
     ·基于词典的排歧方法第16-17页
     ·无指导的排歧方法第17-19页
   ·面临的主要问题第19页
     ·上下文选择第19页
     ·词义的划分第19页
   ·词义排歧的评测方法第19-20页
   ·本文的工作第20-21页
2 面向WSD的AdaBoost.MH算法模型第21-32页
   ·基本概念第21-22页
   ·AdaBoost.MH算法简介第22-28页
     ·AdaBoost算法背景第22-23页
     ·AdaBoost算法基本思想第23-25页
     ·AdaBoost算法误差的分析第25-27页
     ·多类分类问题第27页
     ·AdaBoost算法的优缺点第27-28页
   ·面向WSD的AdaBoost.MH算法描述第28-29页
   ·弱学习器的设计及Z_t的选取第29-32页
3 上下文特征的选择第32-37页
   ·相邻词的词性标注(POS)第32页
   ·局部搭配信息第32-33页
   ·语义范畴信息第33-37页
     ·《同义词词林》简介第33-35页
     ·对《同义词词林》中未登录词的处理第35-36页
     ·语义范畴信息的选取第36-37页
4 汉语AdaBoost.MH-WSD实验第37-47页
   ·语料库第37-39页
     ·人民日报语料第37页
     ·SENSEVAL3中文语料第37-39页
   ·汉语AdaBoost.MH-WSD模型第39-40页
   ·实验评测及结果第40-43页
     ·人民日报语料实验结果与评测第40-41页
     ·SENSEVAL3中文语料实验结果与评测第41-43页
   ·算法中迭代次数的确定第43页
   ·语义信息的引入对排歧效果的影响第43-47页
     ·人民日报语料实验第44-45页
     ·SENSEVAL3中文语料实验第45-47页
5 自动建立带标注语料库的方法第47-55页
   ·自动构建标注语料库的模型第47-51页
     ·搜索关键字的建立第47-50页
     ·语料库的建立和修剪第50-51页
   ·语料库可用性的评测实验与分析第51-55页
     ·语料库第51-52页
     ·语料库中搜索到的新搭配第52页
     ·上下文特征的选取第52页
     ·实验结果及评测第52-53页
     ·迭代次数的分析第53-55页
结论第55-56页
参考文献第56-58页
附录A SENSEVAL3中文语料示例第58-60页
附录B 标注语义范畴信息的语料示例第60-61页
附录C 《同义词词林扩展版》语义信息示例第61-62页
攻读硕士学位期间发表学术论文情况第62-63页
致谢第63-64页
大连理工大学学位论文版权使用授权书第64页

论文共64页,点击 下载论文
上一篇:KAI1复制缺陷型腺病毒载体的构建及其抗胰腺癌转移机制的初步探讨
下一篇:对我国区际民商事管辖权冲突的研究