《蒙古文印刷体扫描识别系统》(recog1.0版)自动校正算法研究
摘要 | 第1-5页 |
ABSTRACT | 第5-8页 |
第一章 引论 | 第8-16页 |
·研究基础 | 第8-10页 |
·软件基础 | 第8-9页 |
·语言学基础 | 第9-10页 |
·词性和词法 | 第9页 |
·短语、词语搭配 | 第9-10页 |
·数学基础 | 第10页 |
·研究方法 | 第10-13页 |
·思路 | 第10-11页 |
·具体步骤 | 第11-12页 |
·语料库来源及说明 | 第12-13页 |
·训练集ECorpus | 第12页 |
·测试文本20TUM | 第12页 |
·短语库 | 第12-13页 |
·研究意义 | 第13-14页 |
·本文章节编排 | 第14-16页 |
第二章 扫描识别文本研究综述 | 第16-24页 |
·文字识别的发展与现状 | 第16-17页 |
·OCR导致的文本错误类型分析 | 第17-18页 |
·文本存在的问题与对策 | 第18-24页 |
·英文文本的错误发现与纠错 | 第18-19页 |
·中文文本的错误类型与纠错 | 第19-20页 |
·蒙文文本的错误类型与应对策略 | 第20-24页 |
·操作步骤 | 第20-21页 |
·文本错误分析 | 第21-23页 |
·纠错方法 | 第23-24页 |
第三章 文本自动校对 | 第24-27页 |
·文本自动校对系统现状 | 第24-25页 |
·系统功能及其评价参数 | 第25-26页 |
·蒙古文自动校对技术 | 第26-27页 |
第四章 蒙古文扫描识别自动校正软件的实现 | 第27-39页 |
·自动校正词典 | 第27页 |
·校正规则 | 第27-31页 |
·字母界限的校正规则 | 第27-28页 |
·字形的校正规则 | 第28-30页 |
·校正规则测试结果 | 第30-31页 |
·基于词语搭配的相似度计算模型 | 第31-37页 |
·基于词语搭配的原因 | 第31页 |
·基于统计模型的书写相似度计算 | 第31-37页 |
·蒙古文扫描识别自动校正系统 | 第37-39页 |
第五章 结束语 | 第39-40页 |
参考文献 | 第40-41页 |
附录1 | 第41-44页 |
附录2 | 第44-45页 |
致谢 | 第45页 |
攻读硕士学位期间发表过的学术论文目录 | 第45页 |