首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--一般性问题论文--理论、方法论文--算法理论论文

一个基于词典与统计的中文分词算法

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-22页
   ·中文分词产生的必然性第9-10页
   ·中文分词的发展概况及现状第10-15页
     ·几个早期的自动分词系统第10-11页
     ·中文分词系统的发展第11-15页
   ·中文分词中的困难第15-17页
     ·分词的规范第15-16页
     ·分词面临的困难第16-17页
   ·中文分词系统的目标第17-18页
     ·准确性第18页
     ·高效性第18页
     ·通用性第18页
     ·适用性第18页
   ·中文分词算法的分类第18-21页
     ·基于字符串匹配的分词方法第18-20页
     ·基于理解的分词方法第20页
     ·基于统计的分词方法第20-21页
   ·论文组织结构第21-22页
第二章 理论基础第22-28页
   ·中文分词需要解决的关键问题第22-23页
     ·歧义的识别第22页
     ·未登录词的识别第22-23页
   ·中文分词的基本方法第23-25页
     ·基于词典的分词方法第23页
     ·基于统计的分词方法第23-25页
   ·歧义规则定义第25-27页
   ·歧义采集方法第27-28页
第三章 基于词典与统计的中文分词算法设计第28-48页
   ·本文要解决的问题第28页
   ·本文采用的分词方法第28-45页
     ·待分析字符串的预处理第29页
     ·基于词典的分词算法的改进第29-44页
     ·基于词典和基于统计方法的有机结合第44-45页
   ·歧义的分析和处理第45-48页
     ·待分文本中歧义的确定第45页
     ·本文的歧义消解算法第45-48页
第四章 基于词典与统计的中文分词算法流程设计第48-60页
   ·算法流程第48-49页
   ·复合分词算法的具体设计第49-60页
     ·算法详细设计流程第49-50页
     ·词典加载第50-53页
     ·待分析字符串断句第53-55页
     ·正向最大匹配算法流程图第55-56页
     ·逆向最大匹配算法流程图第56-57页
     ·歧义处理算法第57-60页
第五章 实验结果第60-66页
   ·结果评价标准第60页
   ·分词效果第60-61页
   ·算法的比较第61-66页
     ·改进的基于词典的算法和普通基于词典的算法的比较第61-62页
     ·复合分词算法与改进的基于字典的算法的比较第62-64页
     ·歧义和未登录词处理的比较第64-66页
第六章 总结和展望第66-68页
致谢第68-69页
参考文献第69-71页
攻硕期间取得的研究成果第71页

论文共71页,点击 下载论文
上一篇:我国法院附设调解制度研究
下一篇:产品设计中感性因素的定位方法研究