摘要 | 第4-5页 |
abstract | 第5页 |
第一章 绪论 | 第8-11页 |
1.1 研究的目的和意义 | 第8页 |
1.2 国内外的研究现状 | 第8-10页 |
1.3 本文章节安排 | 第10-11页 |
第二章 基于Android平台的文字图像二值化 | 第11-22页 |
2.1 Android开发环境搭建 | 第11-13页 |
2.2 图像的灰度化 | 第13-15页 |
2.3 图像的二值化 | 第15-21页 |
2.3.1 大津法阈值 | 第15-17页 |
2.3.2 迭代法阈值 | 第17-21页 |
2.4 本章小结 | 第21-22页 |
第三章 基于Android平台的文字图像倾斜矫正与裁剪 | 第22-35页 |
3.1 图像倾斜矫正 | 第22-28页 |
3.1.1 膨胀和腐蚀 | 第23-24页 |
3.1.2 边缘检测 | 第24-26页 |
3.1.3 基于霍夫变换的文字倾斜角估计 | 第26-27页 |
3.1.4 文字图像倾斜矫正的实现 | 第27-28页 |
3.2 文字部分自动裁剪 | 第28-31页 |
3.2.1 常用的Android文本图像裁剪方法 | 第29-30页 |
3.2.2 本文提出的Android文本图像自动裁剪方法 | 第30-31页 |
3.3 Android平台调用Open CV类库函数 | 第31-33页 |
3.4 本章小结 | 第33-35页 |
第四章 基于Android平台的文字识别 | 第35-47页 |
4.1 tesseract-ocr简介 | 第35-37页 |
4.1.1 tesseract-ocr处理步骤 | 第35-36页 |
4.1.2 支持多种语言 | 第36页 |
4.1.3 字符库训练 | 第36-37页 |
4.2 基于Android平台使用tesseract-ocr引擎 | 第37-38页 |
4.3 图像文字识别的实现 | 第38-39页 |
4.4 训练及扩展语言库提升识别准确率 | 第39-46页 |
4.4.1 训练字符库 | 第39-44页 |
4.4.2 字符库扩展 | 第44-46页 |
4.5 本章小结 | 第46-47页 |
第五章 基于手说TTS实现语音播放 | 第47-54页 |
5.1 语音合成的背景 | 第47页 |
5.2 语音合成的方法 | 第47-49页 |
5.2.1 参数合成方法 | 第48-49页 |
5.2.2 波形拼接方法 | 第49页 |
5.3 基于Android平台语音播放的方法 | 第49-50页 |
5.4 基于手说TTS实现语音播放 | 第50-53页 |
5.4.1 手说TTS简介 | 第50-51页 |
5.4.2 语音播放的实现 | 第51-53页 |
5.5 本章小结 | 第53-54页 |
第六章 图像文字识别及语音播放Android系统设计与实现 | 第54-66页 |
6.1 系统运行环境及开发平台 | 第54-55页 |
6.2 系统的总体设计 | 第55-56页 |
6.3 Android文字图像识别与播放系统测试及分析 | 第56-65页 |
6.3.1 系统的功能测试 | 第56-61页 |
6.3.2 系统测试分析 | 第61-65页 |
6.4 本章小结 | 第65-66页 |
第七章 总结与展望 | 第66-68页 |
7.1 总结 | 第66-67页 |
7.2 展望 | 第67-68页 |
参考文献 | 第68-70页 |
附录 攻读硕士学位期间申请的专利 | 第70-71页 |
致谢 | 第71页 |