基于Hadoop的大规模专利数据翻译与跨语检索系统设计与实现

摘要	第5-6页
Abstract	第6页
第1章绪论	第9-14页
1.1 研究背景与意义	第9-10页
1.2 本文的研究内容	第10-11页
1.3 本文的论文结构	第11-13页
1.4 本章小结	第13-14页
第2章相关技术	第14-27页
2.1 大规模数据处理平台Hadoop	第14-20页
2.1.1 分布式文件系统HDFS	第15-17页
2.1.2 非关系性数据库HBase	第17-19页
2.1.3 分布式处理模型Map Reduce	第19-20页
2.2 Hadoop小文件处理技术	第20-24页
2.2.1 归档文件方法	第21页
2.2.2 序列化文件方法	第21-22页
2.2.3 合并分片方法	第22-24页
2.3 跨语言信息检索技术	第24-25页
2.3.1 文档翻译方法	第24-25页
2.3.2 查询翻译方法	第25页
2.3.3 中间语言方法	第25页
2.3.4 同源匹配方法	第25页
2.4 本章小结	第25-27页
第3章系统总体设计	第27-34页
3.1 设计思路	第27-28页
3.2 总体设计	第28-33页
3.2.1 存储设计	第29页
3.2.2 翻译设计	第29-31页
3.2.3 检索设计	第31-33页
3.3 本章小结	第33-34页
第4章基于HDFS的三层专利数据存储结构	第34-40页
4.1 专利文本存储	第34-36页
4.1.1 待翻译文件的存储	第34-35页
4.1.2 翻译文件的存储	第35-36页
4.2 专利目录存储	第36-37页
4.3 索引存储	第37-39页
4.4 本章小结	第39-40页
第5章基于MAP REDUCE合并分片的专利数据处理方法	第40-56页
5.1 概述	第40-42页
5.1.1 相关概念	第40-41页
5.1.2 专利数据分析	第41页
5.1.3 专利数据分布式翻译可行性分析	第41-42页
5.2 基于Map Reduce的专利小文件数据翻译	第42-49页
5.2.1 专利数据预处理	第43-46页
5.2.2 专利数据翻译处理	第46-47页
5.2.3 专利数据翻译结果分离输出	第47-49页
5.3 实验结果与分析	第49-55页
5.3.1 输入数据统计	第49-50页
5.3.2 实验结果	第50-53页
5.3.3 实验分析	第53-55页
5.4 本章小结	第55-56页
第6章多功能专利数据检索	第56-64页
6.1 跨语检索	第56-61页
6.1.1 词共现迭代消歧算法	第56-57页
6.1.2 基于词共现迭代消歧的跨语检索	第57-61页
6.2 多属性检索	第61-62页
6.3 分类检索	第62-63页
6.4 本章小结	第63-64页
第7章系统应用	第64-68页
结论	第68-69页
参考文献	第69-72页
攻读学位期间发表论文与研究成果清单	第72-73页
致谢	第73页