首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于交叉验证模型选优方法的中文分词系统的设计与开发

中文摘要第1-9页
ABSTRACT第9-11页
第1章 绪论第11-17页
   ·研究背景和意义第11页
   ·国内外研究现状第11-13页
   ·中文分词面临的问题第13-14页
     ·分词规范第13页
     ·歧义切分第13-14页
     ·未登录词第14页
   ·主要研究方法第14-16页
     ·基于词典的分词方法第14-15页
     ·基于理解的分词方法第15页
     ·基于统计的分词方法第15-16页
   ·论文结构安排第16-17页
第2章 条件随机场模型介绍第17-25页
   ·条件随机场第17-18页
   ·标注集介绍第18-19页
   ·特征选择第19-25页
     ·字位置特征和类型特征第19-20页
     ·无监督的NAV特征第20-21页
     ·特征模板设置第21-25页
第3章 语料切分与评测第25-37页
   ·语料来源第25-26页
   ·交叉验证和语料切分第26-27页
   ·评价指标第27-28页
   ·评价指标的方差估计第28-29页
   ·两个系统性能差异的显著性检验第29-36页
   ·两个系统间的一致性检验第36-37页
第4章 实验结果及分析第37-55页
   ·基于标注集的模型结果分析第37-41页
     ·训练语料设置第37页
     ·实验设置第37页
     ·实验结果及分析第37-41页
   ·基于特征模板的模型结果分析第41-50页
     ·训练语料设置第41页
     ·实验设置第41页
     ·实验结果及分析第41-50页
   ·实验得到的其他结论第50-55页
     ·模型选择一致性第50-51页
     ·CRF++模型调节参数选择第51页
     ·训练集规模对模型性能的影响分析第51-55页
第5章 分词系统设计与实现第55-61页
   ·系统设计第55-56页
   ·系统实现第56-59页
   ·系统评测第59-61页
第6章 论文总结和展望第61-63页
   ·论文总结第61页
   ·展望第61-63页
参考文献第63-67页
附录A:山大973样本语料库分词、词性标注加工规范第67-69页
致谢第69-70页
个人简历第70-72页

论文共72页,点击 下载论文
上一篇:山西KXZY公司绩效管理体系的设计
下一篇:仿射不变特征检测算法性能分析