基于统计的汉字识别后处理研究

第1章绪论	第1-13页
·汉字OCR研究背景	第8-9页
·OCR单字识别基本原理简述	第9-10页
·后处理的研究意义	第10-11页
·国内外研究现状及分析	第11-12页
·本文的结构	第12-13页
第2章后处理方法介绍	第13-18页
·简单的词匹配	第13-14页
·综合词匹配	第14页
·词法分析	第14-15页
·句法、语义分析	第15-16页
·人工神经元网络	第16-18页
第3章统计语言模型	第18-26页
·上下文无关模型	第19页
·N元文法模型	第19-21页
·N-POS模型	第21-22页
·基于决策树的语言模型	第22-23页
·动态、自适应、基于缓存的语言模型	第23-24页
·MARKOV模型	第24-26页
第4章文本语料库统计	第26-32页
·语料库统计概述	第26-27页
·二元同现概率统计	第27-29页
·同现概率的计算	第29页
·统计结果及分析	第29-30页
·文本统计仍需进一步做的工作	第30-32页
第5章基于统计汉字识别后处理的实现	第32-38页
·大规模语料库二元同现统计	第32-33页
·候选汉字距离值的处理和利用	第33-34页
·根据候选字距离值做第一步判别处理	第33-34页
·将候选字距离值转化为相对距离尺度	第34页
·MARKOV语言模型的运用	第34-35页
·综合处理	第35-36页
·关于本系统的一些说明	第36页
·关于拒识字	第36页
·首字问题	第36页
·实验结果	第36-38页
第6章结束语	第38-39页
参考文献	第39-42页
攻读硕士学位期间科研工作情况	第42-43页
致谢	第43页