首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

CRFs模型下的中文自动分词研究

摘要第1-5页
Abstract第5-9页
1 绪论第9-15页
   ·研究背景与意义第9页
   ·中文分词技术的难点第9-11页
     ·汉语分词规范第10页
     ·切分歧义问题第10-11页
     ·未登录词问题第11页
   ·主要研究方法第11-13页
   ·研究现状第13-14页
   ·本文研究工作概述第14-15页
2 条件随机场第15-27页
   ·有向图模型第15-21页
     ·隐马尔可夫模型第16-17页
     ·最大熵马尔可夫模型第17-21页
   ·无向图模型第21-22页
     ·无向图中的条件独立性与势函数第21-22页
   ·条件随机场(CRFs)模型第22-27页
     ·CRFs的无向图结构第22页
     ·条件随机场的势函数表示第22-24页
     ·条件随机场的参数估计第24-25页
     ·CRFs的边缘概率第25-26页
     ·CRFs的优势第26-27页
3 基于CRFs边缘概率的中文分词第27-34页
   ·标注集第27页
   ·特征集第27-29页
     ·局部特征第27-28页
     ·词的全局特征第28页
     ·字的全局特征第28-29页
   ·边缘概率的利用与优化第29-31页
     ·字符边缘概率的首次优化第29-30页
     ·用于后处理的词典的构建第30页
     ·重组低边缘概率的候选词第30-31页
   ·使用基于类的隐马尔可夫模型处理子串第31-32页
   ·结合置信度方法得到最终标注结果第32-34页
4 基于改进CRFs的中文分词第34-41页
   ·词图第34页
   ·改进的CRFs第34-36页
   ·特征集第36-37页
   ·未登录词的识别第37-40页
   ·与原始CRFs的区别第40-41页
5 实验结果与分析第41-52页
   ·基于原始CRFs的分词实验第41-46页
     ·实验数据说明第41页
     ·评价参数的定义第41-42页
     ·结果评测第42-45页
     ·结果分析第45-46页
   ·基于改进CRFs的分词实验第46-52页
     ·实验数据说明第46-47页
     ·结果评测第47-48页
     ·角色特征引入后的相关实验第48-50页
     ·综合分析第50-52页
结论第52-54页
参考文献第54-57页
附录A nihao词性标注集第57-60页
攻读硕士学位期间发表学术论文情况第60-61页
致谢第61-62页

论文共62页,点击 下载论文
上一篇:面向产品创新设计的语义关键词专利检索方法
下一篇:基于元搜索的知识获取方法与系统集成研究