语境计算在词语歧义消解中的应用
目录 | 第1-7页 |
第1章 绪论 | 第7-11页 |
·研究目的和意义 | 第7页 |
·自动分词技术的现状 | 第7-8页 |
·自动词性标注技术的现状 | 第8-9页 |
·中科院计算所—ICTCLAS系统概况 | 第9页 |
·国内外语料库的发展概况 | 第9-11页 |
第2章 兼类词消歧和分词消歧现有方法综述 | 第11-14页 |
·兼类词消歧分析 | 第11-12页 |
·分词消歧分析 | 第12-14页 |
·交集型切分歧义分析 | 第12-13页 |
·组合型切分歧义分析 | 第13-14页 |
第3章 基于相对词频的语境计算模型 | 第14-20页 |
·语境计算模型简介 | 第14页 |
·基于相对词频语境计算模型的可行性 | 第14-15页 |
·基于相对词频语境计算模型的统计学模型和算法简介 | 第15-19页 |
·基于相对词频语境计算模型的消歧处理过程和步骤 | 第19-20页 |
第4章 语境计算模型软件的开发 | 第20-23页 |
·开发环境与软件构架 | 第20-21页 |
·全局词频表统计功能的开发 | 第21-22页 |
·训练样本集自动生成功能的开发 | 第22页 |
·训练获得相对词频表功能的开发 | 第22页 |
·消歧功能的开发 | 第22-23页 |
第5章 语境计算模型在消歧中的应用 | 第23-37页 |
·兼类词消歧实验方法 | 第23-24页 |
·兼类词消歧实验结果 | 第24-28页 |
·分词消歧实验方法 | 第28-29页 |
·分词消歧实验结果 | 第29-36页 |
·组合型分词歧义消解实验结果 | 第29-32页 |
·交集型分词歧义消解实验结果 | 第32-36页 |
·消歧速度测试 | 第36-37页 |
第6章 结论 | 第37-39页 |
·完成的工作和特色 | 第37-38页 |
·进一步研究计划 | 第38-39页 |
主要参考文献 | 第39-41页 |
附录 | 第41-61页 |
附录1:北京大学汉语文本词性标注集 | 第41-43页 |
附录2:数据库类的定义和部分代码 | 第43-45页 |
附录3:词频统计类的定义和部分代码 | 第45-47页 |
附录4:汉字信息类的定义和部分代码 | 第47-49页 |
附录5:语境计算模型类的定义和部分代码 | 第49-51页 |
附录6:消歧过程的部分代码 | 第51-52页 |
附录7:“实际”词性标注开放测试中标注错误句子 | 第52-53页 |
附录8:“手指”词性标注开放测试中标注错误句子 | 第53-54页 |
附录9:“从/小学”训练用例句(部分) | 第54-55页 |
附录10:“从小/学”训练用例句 | 第55-56页 |
附录11:“从小学”开放测试集 | 第56-57页 |
附录12:“不/可以”训练用例句(部分) | 第57-58页 |
附录13:“不可/以”训练用例句 | 第58-59页 |
附录14:“不可以”开放测试集 | 第59-61页 |
致谢 | 第61页 |