基于PDF文字流的表格识别技术的研究

摘要	第1-5页
ABSTRACT	第5-9页
第1章绪论	第9-19页
·研究背景	第9页
·研究意义	第9-10页
·相关研究与研究现状	第10-15页
·本文研究思路的形成	第15-16页
·本文的研究内容	第16页
·本文结构	第16-19页
第2章 PDF 格式特征分析	第19-25页
·PDF 介绍	第19-24页
·PDF 的对象	第19-20页
·PDF 的物理结构	第20-22页
·PDF 的逻辑结构	第22页
·PDF 文档示例	第22-24页
·本章小结	第24-25页
第3章基于PDF 文字流的表格识别技术的研究	第25-35页
·PDF 表格识别的关键技术	第25-27页
·文字流生成与指定内容选取	第27-29页
·文字流概念	第27-28页
·文字流生成与指定内容选取	第28-29页
·栅格化	第29-31页
·栅格化概念	第29-30页
·栅格化过程描述	第30-31页
·表格内容归位	第31-32页
·序列化输出	第32-33页
·序列化概念	第32页
·序列化过程描述	第32-33页
·本章小结	第33-35页
第4章 PDF 表格识别系统的设计与实现	第35-61页
·PDF 表格识别系统整体设计	第35-39页
·系统处理流程	第35-37页
·系统层次描述	第37-38页
·系统核心类关系	第38-39页
·PDF 文档处理与封装	第39-41页
·Foxit PDF SDK 2.0	第39页
·页的加载	第39-40页
·页的显示	第40页
·页的放缩和偏移	第40页
·文档内容的拾取	第40页
·PDF 文档处理的封装	第40-41页
·文字流生成与框选内容抽取	第41-44页
·文字流生成	第41页
·内容选取与文字流格式化实现	第41-44页
·栅格化	第44-46页
·栅格化类的设计	第44页
·栅格化实现	第44-46页
·表格内容归位	第46-49页
·表格内容归位相关类设计	第46-47页
·表格内容归位实现	第47-49页
·序列化输出	第49-54页
·HTML 介绍	第49-51页
·序列化输出相关类描述	第51-52页
·序列化输出实现	第52-54页
·测试与分析	第54-60页
·测试环境	第54-55页
·测试流程	第55页
·测试用例设计	第55页
·测试结果	第55-60页
·测试小结	第60页
·本章小结	第60-61页
结论	第61-63页
本文总结	第61-62页
未来工作与展望	第62-63页
参考文献	第63-67页
攻读硕士学位期间发表的学术论文	第67-69页
致谢	第69-70页