首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于统计的汉字识别后处理研究

第1章 绪论第1-13页
   ·汉字OCR研究背景第8-9页
   ·OCR单字识别基本原理简述第9-10页
   ·后处理的研究意义第10-11页
   ·国内外研究现状及分析第11-12页
   ·本文的结构第12-13页
第2章 后处理方法介绍第13-18页
   ·简单的词匹配第13-14页
   ·综合词匹配第14页
   ·词法分析第14-15页
   ·句法、语义分析第15-16页
   ·人工神经元网络第16-18页
第3章 统计语言模型第18-26页
   ·上下文无关模型第19页
   ·N元文法模型第19-21页
   ·N-POS模型第21-22页
   ·基于决策树的语言模型第22-23页
   ·动态、自适应、基于缓存的语言模型第23-24页
   ·MARKOV模型第24-26页
第4章 文本语料库统计第26-32页
   ·语料库统计概述第26-27页
   ·二元同现概率统计第27-29页
   ·同现概率的计算第29页
   ·统计结果及分析第29-30页
   ·文本统计仍需进一步做的工作第30-32页
第5章 基于统计汉字识别后处理的实现第32-38页
   ·大规模语料库二元同现统计第32-33页
   ·候选汉字距离值的处理和利用第33-34页
     ·根据候选字距离值做第一步判别处理第33-34页
     ·将候选字距离值转化为相对距离尺度第34页
   ·MARKOV语言模型的运用第34-35页
   ·综合处理第35-36页
   ·关于本系统的一些说明第36页
     ·关于拒识字第36页
     ·首字问题第36页
   ·实验结果第36-38页
第6章 结束语第38-39页
参考文献第39-42页
攻读硕士学位期间科研工作情况第42-43页
致谢第43页

论文共43页,点击 下载论文
上一篇:激光在线测量技术在静电除尘系统中的应用
下一篇:市场化报纸发行渠道研究