面向增值税发票的图像自动处理技术研究
摘要 | 第5-7页 |
ABSTRACT | 第7-8页 |
主要符号对照表 | 第12-13页 |
1 绪论 | 第13-18页 |
1.1 项目背景 | 第13页 |
1.2 研究重点 | 第13-14页 |
1.3 增值税发票 | 第14-16页 |
1.4 论文结构 | 第16-18页 |
2 发票图像处理基础 | 第18-28页 |
2.1 光栅图像 | 第18-21页 |
2.1.1 光栅图像格式 | 第18-19页 |
2.1.2 灰值图像的相关概念及计算 | 第19-21页 |
2.2 发票图像的获取 | 第21-24页 |
2.3 印刷字符的OCR技术 | 第24-25页 |
2.4 发票图像处理的数学基础 | 第25-27页 |
2.5 小结 | 第27-28页 |
3 发票图像的二值化 | 第28-37页 |
3.1 聚类二值化方法 | 第29-31页 |
3.1.1 大津法 | 第29-30页 |
3.1.2 Kittler法 | 第30-31页 |
3.2 邻域自适应二值化方法 | 第31-35页 |
3.2.1 Niblack法 | 第32-33页 |
3.2.2 Sauvola法 | 第33-34页 |
3.2.3 White法 | 第34-35页 |
3.3 小结 | 第35-37页 |
4 发票图像的彩色分割 | 第37-43页 |
4.1 数字图像的色彩模型 | 第37-38页 |
4.2 发票图像的色差分布图 | 第38-41页 |
4.3 基于色差密度分布的彩色分割 | 第41页 |
4.4 小结 | 第41-43页 |
5 发票表格检测 | 第43-57页 |
5.1 线段检测 | 第43页 |
5.2 改进型有向单连通链方法 | 第43-53页 |
5.2.1 有向单连通链与游程 | 第43-45页 |
5.2.2 游程过滤 | 第45页 |
5.2.3 链的轴估计 | 第45-46页 |
5.2.4 链的过滤 | 第46-48页 |
5.2.5 链的分拆 | 第48-51页 |
5.2.6 链的合并 | 第51-52页 |
5.2.7 轴的延展 | 第52-53页 |
5.3 表格提取 | 第53-56页 |
5.3.1 单元格的拾取 | 第53-54页 |
5.3.2 表格表示法 | 第54-56页 |
5.4 小结 | 第56-57页 |
6 发票表格匹配与分类 | 第57-71页 |
6.1 表格特征集的匹配 | 第57-66页 |
6.1.1 Scott算法 | 第58-59页 |
6.1.2 Shapiro算法 | 第59-60页 |
6.1.3 Shapiro算法的问题 | 第60-65页 |
6.1.4 Blondel算法 | 第65-66页 |
6.2 表格匹配的偏离点 | 第66-68页 |
6.3 表格匹配的相似度 | 第68-69页 |
6.4 发票自动分类 | 第69-70页 |
6.5 小结 | 第70-71页 |
7 发票图像的偏斜纠正 | 第71-75页 |
7.1 基于表格的纠正 | 第71-72页 |
7.2 文本图像的纠正 | 第72-74页 |
7.3 小结 | 第74-75页 |
8 增值税发票扫描识别系统 | 第75-90页 |
8.1 需求概要 | 第75-78页 |
8.2 系统构成 | 第78-79页 |
8.3 识别要素与校验规则 | 第79-80页 |
8.4 扫描客户端设计 | 第80-84页 |
8.5 后台服务器设计 | 第84-85页 |
8.6 系统用户界面 | 第85-88页 |
8.7 系统运行效果 | 第88-89页 |
8.8 小结 | 第89-90页 |
9 全文总结 | 第90-92页 |
附录A 发票票样 | 第92-100页 |
A-1 84位字符密文增值税专用发票票样 | 第92-93页 |
A-2 108位字符密文增值税专用发票票样 | 第93-94页 |
A-3 二维码密文增值税专用发票票样 | 第94-95页 |
A-4 增值税专用发票表格特征图样 | 第95-96页 |
A-5 销货清单图样 | 第96-97页 |
A-6 运输类增值税发票票样 | 第97-98页 |
A-7 运输类普通发票票样 | 第98-99页 |
A-8 测试用增值税发票票样 | 第99-100页 |
附录B发票识别统计报表 | 第100-101页 |
参考文献 | 第101-104页 |
致谢 | 第104-105页 |
攻读学位期间发表的学术论文目录 | 第105-106页 |
攻读学位期间参与的项目 | 第106页 |