摘要 | 第5-6页 |
ABSTRACT | 第6-7页 |
第一章 绪论 | 第10-16页 |
1.1 课题研究背景及意义 | 第10-11页 |
1.2 国内外研究现状 | 第11-13页 |
1.2.1 字符图像识别研究现状 | 第11-12页 |
1.2.2 表格文档识别研究现状 | 第12-13页 |
1.3 论文主要工作 | 第13-14页 |
1.4 论文组织架构 | 第14-16页 |
第二章 表格图像识别研究理论及技术基础 | 第16-24页 |
2.1 图像处理技术及常用类库 | 第16-19页 |
2.1.1 图像处理技术 | 第16-17页 |
2.1.2 图像处理的常用类库 | 第17-19页 |
2.2 字符识别技术及常用的字符识别引擎 | 第19-21页 |
2.2.1 光学字符识别技术 | 第19-20页 |
2.2.2 常用字符识别引擎 | 第20-21页 |
2.3 表格智能识别系统体系架构 | 第21-22页 |
2.4 本章小结 | 第22-24页 |
第三章 表格线检测与单元格定位算法研究 | 第24-38页 |
3.1 表格图像预处理 | 第24-30页 |
3.1.1 表格图像尺寸归一化 | 第25页 |
3.1.2 表格图像灰度化 | 第25-26页 |
3.1.3 灰度表格图像二值化 | 第26-28页 |
3.1.4 表格图像去噪处理 | 第28页 |
3.1.5 表格图像边缘检测 | 第28-29页 |
3.1.6 表格图像数学形态学处理 | 第29-30页 |
3.2 表格图像校正 | 第30-34页 |
3.2.1 表格倾斜校正 | 第30-32页 |
3.2.2 表格透视校正 | 第32-34页 |
3.3 表格线检测及表格单元格定位 | 第34-36页 |
3.3.1 基于Hough变换的参数自适应调整算法 | 第34-36页 |
3.3.2 表格单元格提取及二次单元格定位算法 | 第36页 |
3.4 本章小结 | 第36-38页 |
第四章 表格内容识别算法研究 | 第38-44页 |
4.1 Tesseract-OCR手写数字识别 | 第38-39页 |
4.2 针对特定表格集的识别优化 | 第39-42页 |
4.3 提高识别准确度的其他方法 | 第42-43页 |
4.4 本章小结 | 第43-44页 |
第五章 基于Web的自动录入系统实现与应用 | 第44-54页 |
5.1 自动录入模块开发平台及功能规划 | 第44-46页 |
5.1.1 开发平台 | 第44页 |
5.1.2 功能规划 | 第44-46页 |
5.2 自动录入模块测试与分析 | 第46-47页 |
5.3 电力绝缘子试验自动录入系统实现 | 第47-52页 |
5.3.1 系统的总体架构 | 第47-48页 |
5.3.2 自动录入系统的总体设计 | 第48-49页 |
5.3.3 自动录入系统功能实现与功能展示 | 第49-52页 |
5.4 本章小结 | 第52-54页 |
第六章 结论与展望 | 第54-56页 |
6.1 结论 | 第54-55页 |
6.2 不足与展望 | 第55-56页 |
参考文献 | 第56-60页 |
致谢 | 第60页 |