首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

面向聚类分析的迭代MapReduce计算模型研究

摘要第1-4页
ABSTRACT第4-7页
第一章 绪论第7-12页
   ·研究背景以及意义第7-8页
   ·国内外研究现状以及存在的问题第8-10页
     ·国内外研究现状第8-10页
     ·国内外研究存在的问题第10页
   ·本文研究内容第10-11页
   ·本文章节组织第11-12页
第二章 相关技术综述第12-15页
   ·Hadoop 分布式计算环境第12-13页
     ·Hadoop第12页
     ·HDFS第12-13页
   ·HBase 分布式数据库第13页
     ·HBase第13页
     ·Zookeeper第13页
   ·Mahout 分布式算法库第13-15页
第三章 数据规模对迭代 MapReduce 效率的影响第15-20页
   ·MapReduce 计算模型与迭代问题第15-17页
     ·MapReduce 的单程初衷第15-16页
     ·MapReduce 的迭代困境第16-17页
   ·MapReduce 迭代效率与数据规模第17-20页
     ·不同规模数据的划分方式第17-18页
     ·不同规模数据的优化需求第18-20页
第四章 面向中等规模数据的 MapCombine 方案第20-36页
   ·MapCombine 设计方案概述第20-25页
     ·设计思路第20-21页
     ·加速模型第21-23页
     ·系统架构第23-24页
     ·系统数据流第24-25页
   ·静态数据载入方式的优化第25-28页
     ·数据本地化传输第25-26页
     ·Combiner 的缓存数据功能第26-27页
     ·Combiner 的均衡负载功能第27-28页
     ·数据规模的限制第28页
   ·以单程模式完成迭代第28-32页
     ·Controller 的迭代调度功能第28-29页
     ·标志位迭代控制算法第29-30页
     ·更进一步的负载均衡第30-31页
     ·故障恢复能力第31-32页
   ·实验结果展示及分析第32-36页
     ·实验环境及实验数据第32-33页
     ·实验结果展示及分析第33-36页
第五章 面向大规模数据的 CycleMap 方案第36-50页
   ·CycleMap 设计方案概述第36-41页
     ·设计思路第36-37页
     ·加速模型第37-39页
     ·系统架构第39-40页
     ·系统数据流第40-41页
   ·以流水线的方式完成迭代第41-44页
     ·流水线方式概述第41-42页
     ·Map 任务的输入过程第42页
     ·Collector 的迭代调度功能第42-43页
     ·重用 Java 虚拟机第43-44页
   ·中间结果传输过程的优化第44-46页
     ·中间键值的洗牌与排序第44-45页
     ·Reduce 任务的分解与转移第45-46页
     ·持久化中间结果第46页
   ·实验结果展示及分析第46-50页
     ·实验环境及实验数据第46-47页
     ·实验结果展示及分析第47-50页
第六章 总结与展望第50-51页
参考文献第51-54页
发表论文和参加科研情况说明第54-55页
致谢第55页

论文共55页,点击 下载论文
上一篇:多视角目标追踪在智能监控系统中的研究和应用
下一篇:基于最短路径算法的视频前景物体分割方法研究