首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于MapReduce的海量关系数据处理技术设计与优化

摘要第3-4页
Abstract第4-5页
1 绪论第9-14页
    1.1 研究背景第9-10页
    1.2 国内外研究现状第10-12页
        1.2.1 国外研究现状第10-11页
        1.2.2 国内研究现状第11-12页
    1.3 论文的主要工作第12页
    1.4 论文的结构和安排第12-14页
2 海量关系数据处理相关理论与技术第14-23页
    2.1 海量关系数据特征第14-15页
    2.2 海量关系数据的预处理第15-18页
        2.2.1 数据质量的定义第15页
        2.2.2 数据清洗的定义第15-16页
        2.2.3 数据清洗的方法与分类第16-18页
    2.3 海量关系数据的存储与查询第18-20页
        2.3.1 面向列的关系数据存储第18-19页
        2.3.2 关系数据的连接查询第19-20页
    2.4 基于MapReduce的数据处理综述第20-22页
        2.4.1 主流的大数据计算环境第20-21页
        2.4.2 基于MapReduce的数据处理第21-22页
    2.5 本章小结第22-23页
3 海量关系数据处理系统设计第23-33页
    3.1 系统设计思路第23-25页
    3.2 体系结构第25-26页
    3.3 关系数据去重处理流程第26-29页
        3.3.1 关系数据去重简介第26-27页
        3.3.2 传统关系数据去重技术第27-28页
        3.3.3 MapReduce关系去重技术第28-29页
    3.4 关系数据连接查询处理流程第29-32页
        3.4.1 两表连接查询流程第29-32页
        3.4.2 多表连接查询流程第32页
    3.5 本章小结第32-33页
4 海量关系数据处理系统优化第33-48页
    4.1 海量关系数据去重优化第33-38页
        4.1.1 去重改进思路第33-35页
        4.1.2 MapReduce的流式处理第35-38页
    4.2 海量关系数据查询优化第38-47页
        4.2.1 连接查询的改进思路第38页
        4.2.2 基于SMapReduce连接查询的优化思路第38-40页
        4.2.3 连接查询改进后的框架第40-43页
        4.2.4 两表连接查询处理流程改进第43-44页
        4.2.5 多表连接查询处理流程改进第44-47页
    4.3 本章小结第47-48页
5 实验及结果分析第48-59页
    5.1 测试环境和系统第48-50页
        5.1.1 测试环境第48-50页
    5.2 去重测试与结果分析第50-53页
        5.2.1 传统去重与MapReduce去重对比第50-52页
        5.2.2 改进MapReduce与MapReduce去重对比第52-53页
    5.3 查询测试与结果分析第53-58页
        5.3.1 改进MapReduce与MapReduce查询时间对比第53-55页
        5.3.2 过滤百分比第55-56页
        5.3.3 改进MapReduce与SMapReduce查询时间对比第56-58页
    5.4 本章小结第58-59页
6 总结与展望第59-61页
    6.1 工作总结第59页
    6.2 未来展望第59-61页
致谢第61-62页
参考文献第62-65页
附录1 攻读硕士学位期间参与的项目和发表的论文第65页

论文共65页,点击 下载论文
上一篇:基于灰色关联度推理的水质评价管理系统的研究与应用
下一篇:一种基于移动互联网的工作流系统设计及实现