首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

MapReduce上在线聚集函数的应用研究

摘要第6-7页
ABSTRACT第7页
第1章 绪论第8-10页
    1.1 本论文的背景和意义第8-9页
    1.2 本论文的结构第9-10页
第2章 背景知识第10-24页
    2.1 MAPREDUCE第10-11页
    2.2 HADOOP第11-18页
        2.2.0 优缺点第11-12页
        2.2.1 存储框架第12-14页
            2.2.1.1 体系结构第12-14页
        2.2.2 计算框架第14-16页
        2.2.3 RPC通信第16-17页
        2.2.4 研究现状第17-18页
    2.3 HOP第18-19页
        2.3.1 管道思想第18-19页
        2.3.2 Map输出粒度第19页
        2.3.3 中间结果第19页
    2.4 HBASE第19-22页
        2.4.1 HBase数据模型第20-21页
        2.4.2 HBase系统框架第21-22页
    2.5 流数据第22页
    2.6 在线聚集第22-23页
    2.7 依赖项目第23-24页
第3章 系统描述第24-42页
    3.1 编程模型第24-27页
        3.1.1 编程模型第25-26页
        3.1.2 与HOP的对比第26-27页
    3.2 困难及解决方法第27-30页
        3.2.1 数据传输与保存第27页
        3.2.2 Map、Reduce的输出粒度第27-28页
        3.2.3 内存占用第28页
        3.2.4 容错第28页
        3.2.5 中间结果的证明第28-29页
        3.2.6 MapTable分发第29-30页
    3.3 系统详细描述第30-35页
        3.3.1 Map流程介绍第30-31页
        3.3.2 Combiner流程介绍第31-32页
        3.3.3 Reduce流程介绍第32-33页
        3.3.4 任务调度第33-34页
        3.3.5 增量式计算第34-35页
    3.4 数据传输第35-37页
        3.4.1 数据传输第35-36页
        3.4.2 MapTable文件格式第36页
        3.4.3 MapBase发送文件第36-37页
        3.4.4 Reduce接收文件第37页
    3.5 容错与证明第37-42页
        3.5.1 容错机制第37-39页
        3.5.2 正确性证明第39-40页
        3.5.3 代价评估第40-42页
第4章 代码示例第42-46页
    4.1 用户使用举例第42页
    4.2 用户自定义类第42-43页
    4.3 框架实现类第43-46页
        4.3.1 编程模型类第43-44页
        4.3.2 文件传输类第44-46页
第5章 实验第46-49页
    5.1 实验环境第46页
    5.2 实验数据第46页
    5.3 实验结果第46-49页
        5.3.1 中间结果出现时间第46-48页
        5.3.2 网络对性能的影响第48页
        5.3.3 CPU对性能的影响第48-49页
结论第49-50页
致谢第50-51页
参考文献第51-52页
附录1 用户自定义类第52-53页
附录2 参数设置第53-54页
附录3 实验代码第54-55页
附录4 实验数据第55-56页
附录5 实验代码第56-57页

论文共57页,点击 下载论文
上一篇:跨模态信息检索方法的研究与实现
下一篇:精神残疾不同康复模式的成本—效用分析