基于图像特征及OCR的垃圾图像过滤方法研究
摘要 | 第3-4页 |
Abstract | 第4页 |
1 绪论 | 第7-14页 |
1.1 研究背景和选题意义 | 第7-9页 |
1.2 国内外研究现状 | 第9-12页 |
1.3 研究内容及主要结构 | 第12-14页 |
2 垃圾图像过滤技术概述 | 第14-20页 |
2.1 垃圾图像及其分类 | 第14-15页 |
2.2 垃圾图像的特性 | 第15页 |
2.3 垃圾图像过滤研究现状 | 第15-17页 |
2.3.1 基于图像内容特征的过滤方法 | 第16页 |
2.3.2 基于文本内容的图像过滤方法 | 第16-17页 |
2.4 垃圾图像的数据集 | 第17-19页 |
2.5 本章小结 | 第19-20页 |
3 基于改进的图像特征融合方法的过滤 | 第20-31页 |
3.1 图像特征提取 | 第20-24页 |
3.1.1 颜色特征 | 第20-21页 |
3.1.2 梯度特征 | 第21页 |
3.1.3 HOG特征 | 第21-24页 |
3.2 垃圾图像分类识别算法 | 第24-27页 |
3.2.1 AdaBoost算法 | 第24-26页 |
3.2.2 KNN算法 | 第26-27页 |
3.3 改进的特征融合算法 | 第27-30页 |
3.3.1 特征决策的先后顺序 | 第28-29页 |
3.3.2 阈值的选定 | 第29-30页 |
3.4 本章小结 | 第30-31页 |
4 结合短文本分类的基于OCR的过滤方法 | 第31-49页 |
4.1 文本检测 | 第31-35页 |
4.1.1 颜色空间转换 | 第31-32页 |
4.1.2 边缘检测 | 第32页 |
4.1.3 形态学运算 | 第32-34页 |
4.1.4 连通域过滤 | 第34-35页 |
4.2 文本识别 | 第35-40页 |
4.2.1 基于傅立叶的倾斜矫正 | 第35-36页 |
4.2.2 统一背景的二值化 | 第36-38页 |
4.2.3 基于投影的单字分割 | 第38-39页 |
4.2.4 OCR识别 | 第39-40页 |
4.3 文本特征提取 | 第40-45页 |
4.3.1 TF-IDF | 第40-41页 |
4.3.2 卡方检验 | 第41-42页 |
4.3.3 LDA主题模型 | 第42-43页 |
4.3.4 改进的文本特征提取方法 | 第43-45页 |
4.4 文本分类SVM算法 | 第45-48页 |
4.5 本章小结 | 第48-49页 |
5 多层过滤系统的设计与实现 | 第49-56页 |
5.1 系统总体设计框图 | 第49-50页 |
5.2 粗分类过滤系统 | 第50-52页 |
5.2.1 基于特征的过滤系统框架 | 第50页 |
5.2.2 基于特征的过滤系统的实验结果 | 第50-52页 |
5.3 细分类过滤系统 | 第52-55页 |
5.3.1 基于内容的过滤系统框架 | 第52-53页 |
5.3.2 基于内容的过滤系统的实验结果 | 第53-55页 |
5.4 本章小结 | 第55-56页 |
6 总结和展望 | 第56-58页 |
6.1 总结 | 第56页 |
6.2 展望 | 第56-58页 |
致谢 | 第58-59页 |
参考文献 | 第59-63页 |