红头文件检测关键技术研究

摘要	第4-6页
ABSTRACT	第6-7页
1 绪论	第10-13页
1.1 研究背景及意义	第10页
1.2 研究现状	第10-11页
1.2.1 多模式匹配研究现状	第10-11页
1.2.2 图片中文字识别研究现状	第11页
1.3 论文主要工作及结构安排	第11-13页
2 中英文文本多模式匹配	第13-21页
2.1 模式匹配技术	第13-16页
2.1.1 模式匹配算法思想	第13-14页
2.1.2 经典模式匹配算法	第14-16页
2.2 多模式匹配技术	第16-18页
2.3 中英文文本多模式匹配技术	第18-20页
2.3.1 DFSA-QS算法	第18-19页
2.3.2 THT算法	第19-20页
2.4 本章小结	第20-21页
3 文本类文件检测关键技术	第21-31页
3.1 常见编码方式及特征	第22-23页
3.1.1 ASCII码	第22页
3.1.2 GB2312、GBK和BIG5编码	第22页
3.1.3 Unicode系列编码	第22-23页
3.2 编码判定和误匹配检测模块	第23-29页
3.2.1 编码分析模块设计	第23-25页
3.2.2 误匹配判断模块设计	第25-29页
3.3 文本类文件检测整体流程	第29-30页
3.4 本章小结	第30-31页
4 图片类文件检测关键技术	第31-45页
4.1 Tesseract-ocr性能测试	第31-33页
4.2 图片预处理	第33-41页
4.2.1 基于霍夫线变换的图像倾斜检测	第33-37页
4.2.2 透视变换	第37-38页
4.2.3 基于霍夫圆变换的印章检测	第38-40页
4.2.4 自适应阈值二值化	第40-41页
4.3 Tesseract-ocr字库训练	第41-43页
4.4 图片类文件检测整体流程	第43-44页
4.5 本章小结	第44-45页
5 检测系统设计与实现	第45-48页
5.1 文本类文件检测实现	第45-46页
5.2 图片类文件检测实现	第46-47页
5.3 本章小结	第47-48页
6 总结与展望	第48-49页
6.1 总结	第48页
6.2 展望	第48-49页
参考文献	第49-53页
附录	第53-56页
攻读学位期间的研究成果	第56-57页
致谢	第57页