首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Hadoop的大规模专利数据翻译与跨语检索系统设计与实现

摘要第5-6页
Abstract第6页
第1章 绪论第9-14页
    1.1 研究背景与意义第9-10页
    1.2 本文的研究内容第10-11页
    1.3 本文的论文结构第11-13页
    1.4 本章小结第13-14页
第2章 相关技术第14-27页
    2.1 大规模数据处理平台Hadoop第14-20页
        2.1.1 分布式文件系统HDFS第15-17页
        2.1.2 非关系性数据库HBase第17-19页
        2.1.3 分布式处理模型Map Reduce第19-20页
    2.2 Hadoop小文件处理技术第20-24页
        2.2.1 归档文件方法第21页
        2.2.2 序列化文件方法第21-22页
        2.2.3 合并分片方法第22-24页
    2.3 跨语言信息检索技术第24-25页
        2.3.1 文档翻译方法第24-25页
        2.3.2 查询翻译方法第25页
        2.3.3 中间语言方法第25页
        2.3.4 同源匹配方法第25页
    2.4 本章小结第25-27页
第3章 系统总体设计第27-34页
    3.1 设计思路第27-28页
    3.2 总体设计第28-33页
        3.2.1 存储设计第29页
        3.2.2 翻译设计第29-31页
        3.2.3 检索设计第31-33页
    3.3 本章小结第33-34页
第4章 基于HDFS的三层专利数据存储结构第34-40页
    4.1 专利文本存储第34-36页
        4.1.1 待翻译文件的存储第34-35页
        4.1.2 翻译文件的存储第35-36页
    4.2 专利目录存储第36-37页
    4.3 索引存储第37-39页
    4.4 本章小结第39-40页
第5章 基于MAP REDUCE合并分片的专利数据处理方法第40-56页
    5.1 概述第40-42页
        5.1.1 相关概念第40-41页
        5.1.2 专利数据分析第41页
        5.1.3 专利数据分布式翻译可行性分析第41-42页
    5.2 基于Map Reduce的专利小文件数据翻译第42-49页
        5.2.1 专利数据预处理第43-46页
        5.2.2 专利数据翻译处理第46-47页
        5.2.3 专利数据翻译结果分离输出第47-49页
    5.3 实验结果与分析第49-55页
        5.3.1 输入数据统计第49-50页
        5.3.2 实验结果第50-53页
        5.3.3 实验分析第53-55页
    5.4 本章小结第55-56页
第6章 多功能专利数据检索第56-64页
    6.1 跨语检索第56-61页
        6.1.1 词共现迭代消歧算法第56-57页
        6.1.2 基于词共现迭代消歧的跨语检索第57-61页
    6.2 多属性检索第61-62页
    6.3 分类检索第62-63页
    6.4 本章小结第63-64页
第7章 系统应用第64-68页
结论第68-69页
参考文献第69-72页
攻读学位期间发表论文与研究成果清单第72-73页
致谢第73页

论文共73页,点击 下载论文
上一篇:含交易费用及税收的二元市场期权定价
下一篇:带有成比例交易费用的欧式期权的对冲