纸质目录卡片的数字化转换及MapReduce并行处理

摘要	第9-10页
ABSTRACT	第10页
第一章绪论	第11-17页
1.1 研究背景和意义	第11-12页
1.2 研究现状	第12-15页
1.2.1 OCR研究现状	第12-13页
1.2.2 纸质目录卡片识别发展现状	第13-14页
1.2.3 并行光学字符识别研究现状	第14-15页
1.3 本文的主要工作	第15页
1.4 论文的框架结构	第15-17页
第二章相关技术研究	第17-34页
2.1 Characterness	第17-23页
2.1.1 Characterness模型	第18-21页
2.1.2 字符标注和分组	第21-22页
2.1.3 Characterness方法总结	第22-23页
2.2 Hadoop计算平台	第23-27页
2.2.1 hadoop基本架构	第23-24页
2.2.2 HDFS架构	第24-27页
2.3 MapReduce并行处理模型	第27-29页
2.4 光学字符识别（OCR）	第29-34页
2.4.1 OCR的发展和应用	第29-31页
2.4.2 OCR的工作过程	第31-34页
第三章目录卡片多元信息提取	第34-54页
3.1 目录卡片信息特征分析	第34-35页
3.2 目录卡片多元信息提取	第35-45页
3.2.1 文字区域提取	第36-37页
3.2.2 基于单词位置信息的语句定位	第37-39页
3.2.3 基于语句位置信息的语句属性确定	第39-40页
3.2.4 OCR识别	第40-44页
3.2.5 目录卡片数字化转换算法	第44-45页
3.3 实验评估	第45-52页
3.3.1 实验环境搭建	第45-48页
3.3.2 实验结果及分析	第48-52页
3.4 小结	第52-54页
第四章并行纸质目录卡片识别	第54-69页
4.1 并行设计框架	第54-56页
4.2 存储管理	第56-57页
4.3 并行程序设计	第57-62页
4.3.1 并行处理过程	第57-58页
4.3.2 图像文件的输入格式	第58-60页
4.3.3 并行目录卡片识别设计	第60-62页
4.4 任务调度和执行	第62-63页
4.5 实验与评估	第63-69页
4.5.1 环境配置	第63-65页
4.5.2 实验结果与分析	第65-69页
第五章总结与展望	第69-71页
5.1 总结	第69页
5.2 展望	第69-71页
致谢	第71-72页
参考文献	第72-76页
作者在学期间取得的学术成果	第76页