首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

格式化文件内容提取与过滤关键技术研究

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-13页
   ·课题背景及意义第10-11页
   ·论文研究内容第11页
   ·论文组织结构第11-13页
第2章 格式化文件内容提取与布尔表达式匹配算法研究第13-26页
   ·引言第13页
   ·格式化文件内容提取技术第13-19页
     ·格式化文件内容提取技术国内外研究现状第13-14页
     ·Office2007 文件格式研究第14-17页
     ·PDF 文件格式研究第17-19页
   ·PDF 中文文件编码转换第19-23页
     ·编码转换研究第19-21页
     ·ToUnicode 编码转换第21-23页
   ·布尔表达式匹配算法第23-25页
     ·布尔表达式研究与分析第23页
     ·布尔表达式匹配算法国内外研究现状第23-25页
   ·本章小结第25-26页
第3章 基于网络传输的格式化文件内容实时提取第26-41页
   ·引言第26页
   ·格式化文件内容提取框架第26-30页
     ·内容提取总体框架第26页
     ·分片解压第26-28页
     ·分片缓存第28-29页
     ·特征查找第29页
     ·正文提取第29-30页
   ·Office2007 文档内容实时提取第30-33页
     ·Word2007 文档内容提取第31-32页
     ·Excel2007 文档内容提取第32-33页
     ·PowerPoint2007 文档内容提取第33页
   ·PDF 文件内容实时提取第33-36页
     ·线性化 PDF 文件第33-34页
     ·中文编码转换第34-35页
     ·正文内容提取第35-36页
   ·实验结果与分析第36-40页
     ·内容提取正确性第36-39页
     ·内容提取的性能第39-40页
   ·本章小结第40-41页
第4章 布尔表达式匹配算法研究第41-65页
   ·引言第41页
   ·布尔表达式匹配算法研究第41-49页
     ·计数算法第41-43页
     ·前缀算法第43-45页
     ·区间算法第45-48页
     ·算法总结与分析第48-49页
   ·区间法优化方案第49-54页
     ·匹配算法的优化第49-51页
     ·标记算法的优化第51-54页
   ·实验结果分析第54-64页
     ·优化匹配算法评测第54-58页
     ·优化标记算法评测第58-64页
   ·本章小结第64-65页
结论第65-66页
参考文献第66-70页
致谢第70页

论文共70页,点击 下载论文
上一篇:基于表单特性的深层网络数据源分类方法研究
下一篇:面向企业网的网络数据流分析及网络优化研究