首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

规则与统计相结合的中文分词方法研究

中文摘要第1-6页
ABSTRACT第6-12页
第一章 引言第12-20页
   ·研究背景第12-13页
     ·问题概述第12页
     ·中文自动分词的重要性第12-13页
   ·中文自动分词的困难第13-15页
   ·中文分词的研究现状及其分析第15-18页
   ·论文的主要工作及论文结构第18-20页
第二章 资源库的建立第20-26页
   ·伪歧义字段资源库第20-22页
   ·真歧义字段资源库第22-24页
     ·真歧义字段的分类第22-23页
     ·真歧义字段资源库的建立第23-24页
   ·未登录词资源库第24-26页
第三章 歧义字段的处理策略第26-34页
   ·伪歧义字段的处理策略第26页
   ·真歧义字段1的处理策略第26-27页
   ·真歧义字段2的处理策略第27-31页
     ·问题描述第27页
     ·特征的提取第27-29页
     ·特征模板的筛选第29-30页
     ·影响因子(特征参数bi)第30-31页
   ·举例第31-34页
第四章 未登录词的识别第34-42页
   ·未登录词识别的难点第34-35页
   ·未登录词识别的概率模型第35-36页
   ·未登录词识别的规则库第36-38页
     ·姓名的规则库建造第36-37页
     ·地名识别规则库的建造第37-38页
     ·机构名称的自动识别技术第38页
   ·未登录词识别过程第38-42页
第五章 实验结果与分析第42-46页
   ·基本流程第42页
   ·实验语料第42页
   ·评价方法第42-43页
   ·实验结果第43-46页
     ·实验结果分析第43-44页
     ·错误识别举例与分析第44-46页
结论与展望第46-47页
参考文献第47-50页
致谢第50-51页
发表文章第51-52页
个人简历第52-53页

论文共53页,点击 下载论文
上一篇:非平衡数据集分类算法及其应用
下一篇:全固态连续单频钛宝石激光器