基于深度学习和知识策略的蒙古文古籍识别研究
摘要 | 第4-6页 |
ABSTRACT | 第6-8页 |
第1章 引言 | 第15-29页 |
1.1 课题的背景和意义 | 第15-16页 |
1.2 文字识别技术的发展与现状 | 第16-20页 |
1.3 蒙古文古籍介绍 | 第20-25页 |
1.3.1 古典蒙古文 | 第20-23页 |
1.3.2 蒙古文古籍 | 第23-25页 |
1.4 本文的研究内容和创新点 | 第25-27页 |
1.4.1 研究内容 | 第25-26页 |
1.4.2 创新点 | 第26-27页 |
1.5 论文结构安排 | 第27-29页 |
第2章 蒙古文古籍识别方案及预处理 | 第29-41页 |
2.1 引言 | 第29页 |
2.2 蒙古文古籍识别方案 | 第29-35页 |
2.2.1 识别单元和编码方案 | 第29-32页 |
2.2.2 识别方案和流程 | 第32-33页 |
2.2.3 单词识别方法的选择 | 第33-35页 |
2.3 蒙古文古籍预处理 | 第35-39页 |
2.3.1 文档二值化 | 第35-36页 |
2.3.2 文档列切分 | 第36-37页 |
2.3.3 单词切分 | 第37-39页 |
2.3.4 单词去噪 | 第39页 |
2.4 小结 | 第39-41页 |
第3章 基于卷积神经网络的整词识别 | 第41-59页 |
3.1 引言 | 第41页 |
3.2 卷积神经网络 | 第41-50页 |
3.2.1 深度学习介绍 | 第41-43页 |
3.2.2 卷积神经网络 | 第43-50页 |
3.3 半自动选取训练样本 | 第50-53页 |
3.4 卷积神经网络参数训练 | 第53-55页 |
3.5 实验 | 第55-58页 |
3.5.1 蒙古文古籍标注 | 第55页 |
3.5.2 实验数据 | 第55-56页 |
3.5.3 实验结果及分析 | 第56-58页 |
3.6 小结 | 第58-59页 |
第4章 基于字形基元切分的单词识别 | 第59-81页 |
4.1 引言 | 第59-60页 |
4.2 基于轮廓分析的字形基元切分 | 第60-70页 |
4.2.1 轮廓关键点检测 | 第60-65页 |
4.2.2 主干线定位 | 第65-66页 |
4.2.3 分割线生成 | 第66-70页 |
4.3 基于卷积神经网络的字形基元识别 | 第70页 |
4.4 基于知识的系统性能提升策略 | 第70-75页 |
4.4.1 整合主干线信息 | 第72-73页 |
4.4.2 字形基元分组 | 第73-74页 |
4.4.3 识别欠切分和过切分片段 | 第74-75页 |
4.5 实验 | 第75-79页 |
4.5.1 实验数据和参数设置 | 第75-76页 |
4.5.2 性能评测 | 第76-79页 |
4.6 小结 | 第79-81页 |
第5章 识别后处理 | 第81-95页 |
5.1 引言 | 第81-82页 |
5.2 错误检测 | 第82-85页 |
5.2.1 古典蒙古文词典构建 | 第82-83页 |
5.2.2 字形基元相邻规则 | 第83-85页 |
5.3 错误校正 | 第85-91页 |
5.3.1 加权编辑距离模型 | 第85-88页 |
5.3.2 改进噪声信道模型 | 第88-91页 |
5.4 实验 | 第91-93页 |
5.4.1 实验数据 | 第91页 |
5.4.2 实验结果及分析 | 第91-93页 |
5.5 小结 | 第93-95页 |
第6章 总结与展望 | 第95-98页 |
6.1 本文工作总结 | 第95-96页 |
6.2 未来工作展望 | 第96-98页 |
参考文献 | 第98-113页 |
致谢 | 第113-114页 |
攻读博士学位期间发表的论文 | 第114-116页 |
攻读博士学位期间参加的科研项目 | 第116页 |