首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于互信息的统计语言模型平滑技术

中文摘要第1-5页
英文摘要第5-9页
1 绪论第9-15页
   ·问题的提出及研究意义第9-10页
     ·问题的提出第9-10页
     ·研究的意义第10页
   ·国内外研究现状第10-11页
   ·本文研究的目的和研究内容第11页
     ·本文研究的目的第11页
     ·本文研究的主要内容第11页
   ·本文所使用的技术第11-14页
     ·Microsoft .Net4第11-12页
     ·C#开发语言第12-14页
   ·本文的主要内容第14-15页
2 统计语言模型及其平滑技术第15-27页
   ·概率论基础第15-17页
     ·基本概率第15页
     ·最大似然估计(Maximum Likelihood Estimation)第15-16页
     ·熵(Entropy)第16页
     ·困惑度(Perplexity)第16页
     ·互信息(Mutual information)第16-17页
   ·统计语言模型第17-20页
     ·语言模型第17-18页
     ·N-gram 模型第18-19页
     ·统计语言模型的评价标准第19页
     ·统计语言模型的数据稀疏问题第19-20页
   ·现有的平滑技术第20-26页
     ·Good-Turing 估计第20-21页
     ·加法平滑技术第21页
     ·回退平滑技术第21-23页
     ·插值平滑技术第23-26页
   ·本章小结第26-27页
3 统计语言模型的建立第27-34页
   ·提出问题第27-28页
   ·建立模型第28-33页
     ·建立一元模型第28页
     ·二元模型的建立第28-33页
     ·三元模型及N 元模型的建立第33页
     ·结论第33页
   ·本章小结第33-34页
4 基于互信息的统计语言模型平滑技术第34-42页
   ·基本思想第34页
   ·归一性问题第34-35页
   ·概率分布问题第35-36页
   ·基于互信息的平滑技术第36-40页
     ·基本公式第36-37页
     ·约束条件第37-39页
     ·系数的选取原则-极小化困惑度第39-40页
   ·应用及推广第40-41页
   ·本章小结第41-42页
5 实验方法及结果分析第42-49页
   ·实验方法第42-44页
     ·数据第42页
     ·语料处理第42-43页
     ·系数的确定第43-44页
   ·实验结果第44-46页
     ·现有平滑技术第44-45页
     ·基于互信息平滑的最小困惑度第45页
     ·指定系数值下模型的困惑度第45-46页
   ·中文自动分词系统第46-47页
     ·中文自动分词系统核心功能模块第46-47页
     ·中文自动分词系统流程图第47页
   ·本章小结第47-49页
6 结论与展望第49-50页
   ·主要结论第49页
   ·后续研究工作的展望第49-50页
致谢第50-51页
参考文献第51-53页
附录 作者在攻读博士学位期间的其它工作第53-54页
独创性声明第54页
学位论文版权使用授权书第54页

论文共54页,点击 下载论文
上一篇:商品房质量问题法律研究
下一篇:个性化服务中用户兴趣模型的研究