基于AdaBoost.MH算法的汉语多义词消歧

摘要	第1-5页
Abstract	第5-8页
引言	第8-11页
1 问题描述	第11-21页
·词义排歧的提出及其意义	第11-13页
·词义排歧	第11-12页
·词义排歧研究的意义	第12-13页
·国内外的研究状况	第13-19页
·有指导排歧方法	第13-16页
·基于词典的排歧方法	第16-17页
·无指导的排歧方法	第17-19页
·面临的主要问题	第19页
·上下文选择	第19页
·词义的划分	第19页
·词义排歧的评测方法	第19-20页
·本文的工作	第20-21页
2 面向WSD的AdaBoost.MH算法模型	第21-32页
·基本概念	第21-22页
·AdaBoost.MH算法简介	第22-28页
·AdaBoost算法背景	第22-23页
·AdaBoost算法基本思想	第23-25页
·AdaBoost算法误差的分析	第25-27页
·多类分类问题	第27页
·AdaBoost算法的优缺点	第27-28页
·面向WSD的AdaBoost.MH算法描述	第28-29页
·弱学习器的设计及Z_t的选取	第29-32页
3 上下文特征的选择	第32-37页
·相邻词的词性标注(POS)	第32页
·局部搭配信息	第32-33页
·语义范畴信息	第33-37页
·《同义词词林》简介	第33-35页
·对《同义词词林》中未登录词的处理	第35-36页
·语义范畴信息的选取	第36-37页
4 汉语AdaBoost.MH-WSD实验	第37-47页
·语料库	第37-39页
·人民日报语料	第37页
·SENSEVAL3中文语料	第37-39页
·汉语AdaBoost.MH-WSD模型	第39-40页
·实验评测及结果	第40-43页
·人民日报语料实验结果与评测	第40-41页
·SENSEVAL3中文语料实验结果与评测	第41-43页
·算法中迭代次数的确定	第43页
·语义信息的引入对排歧效果的影响	第43-47页
·人民日报语料实验	第44-45页
·SENSEVAL3中文语料实验	第45-47页
5 自动建立带标注语料库的方法	第47-55页
·自动构建标注语料库的模型	第47-51页
·搜索关键字的建立	第47-50页
·语料库的建立和修剪	第50-51页
·语料库可用性的评测实验与分析	第51-55页
·语料库	第51-52页
·语料库中搜索到的新搭配	第52页
·上下文特征的选取	第52页
·实验结果及评测	第52-53页
·迭代次数的分析	第53-55页
结论	第55-56页
参考文献	第56-58页
附录A SENSEVAL3中文语料示例	第58-60页
附录B 标注语义范畴信息的语料示例	第60-61页
附录C 《同义词词林扩展版》语义信息示例	第61-62页
攻读硕士学位期间发表学术论文情况	第62-63页
致谢	第63-64页
大连理工大学学位论文版权使用授权书	第64页