首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于统计机器学习算法的汉语分词系统的研究

第一章 绪论第1-15页
   ·本文研究的背景及意义第8-9页
   ·国内外研究现状第9-13页
     ·汉语自动分词的研究现状第9-11页
     ·汉语自动分词的难点第11-13页
   ·本文的主要研究内容第13-14页
     ·模型训练第13页
     ·基于类的语言模型的汉语自动分词第13-14页
   ·本文的研究成果第14-15页
第二章 研究平台的建立及描述第15-19页
   ·研究平台的建立第15-16页
   ·SRILM概述第16-19页
第三章 汉语自动分词第19-34页
   ·汉语自动分词概述第19-22页
     ·汉语自动分词的现实性和可行性第19-20页
     ·汉语自动分词的性能评价第20-22页
   ·统计语言模型第22-30页
     ·N-gram模型第22-25页
     ·HMM(Hidden Markov Model)模型第25-26页
     ·参数估计与数据稀疏问题第26-30页
   ·汉语自动分词基本算法第30-34页
     ·基于词典的分词算法第30-31页
     ·基于统计的分词算法第31-32页
     ·混合的分词方法第32-34页
第四章 基于类的语言模型的汉语自动分词系统第34-44页
   ·类的定义第34-35页
   ·基于类的语言模型的形式化描述第35-40页
   ·基于类的汉语自动分词系统的架构第40-44页
     ·基于类的模型估计模块第40-42页
     ·基于类的解码模块第42-44页
第五章 实验结果和分析第44-56页
   ·测试指标第44-45页
   ·数据集第45-46页
     ·测试数据第45页
     ·训练数据第45-46页
   ·实验第46-51页
     ·实验一:基于前向最大匹配的汉语自动分词第46-47页
     ·实验二:基于词的3元模型的汉语自动分词第47-48页
     ·实验三:基于类的语言模型的汉语自动分词第48-50页
     ·在MET2的测试集上的结果第50-51页
   ·分析与讨论第51-56页
     ·类别错误第52-53页
     ·边界错误第53-55页
     ·歧义切分字段错误第55-56页
第六章 结论与展望第56-58页
参考文献第58-61页
致谢第61页

论文共61页,点击 下载论文
上一篇:阳离子型絮凝剂丙烯酰胺—二甲基二烯丙基氯化铵共聚物的合成研究
下一篇:我国国有企业多元化经营的案例研究