首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

MapReduce的数据集成系统的设计与实现

摘要第5-6页
Abstract第6页
第1章 绪论第11-17页
    1.1 研究背景及意义第11-12页
    1.2 研究基础第12-13页
    1.3 国内外研究现状第13-15页
    1.4 论文主要研究内容第15页
    1.5 论文组织结构第15-17页
第2章 分布式并行数据集成方法第17-23页
    2.1 Hadoop第17-18页
        2.1.1 MapReduce编程模型第17页
        2.1.2 Hadop的优势和劣势第17-18页
    2.2 系统架构第18-19页
    2.3 研究目标第19-23页
        2.3.1 集成策略第19-21页
        2.3.2 数据布局方法第21-23页
第3章 数据集成策略第23-39页
    3.1 相关定义第23-26页
        3.1.1 用例第23页
        3.1.2 操作第23-24页
        3.1.3 Join算法第24-26页
    3.2 基于Hadop的数据集成策略第26-34页
        3.2.1 Map端集成策略(MSIS)第27-28页
        3.2.2 Reduce端集成策略(RSIS)第28-30页
        3.2.3 高级Map端集成策略(AMSIS)第30-32页
        3.2.4 高级Reduce端集成策略(ARSIS)第32-34页
    3.3 策略评估算法第34-39页
        3.3.1 I/O代价模型第34-35页
        3.3.2 符号和定义第35-36页
        3.3.3 策略的I/O代价第36-39页
第4章 数据布局方法第39-47页
    4.1 研究目标第39-40页
    4.2 数据布局方法第40-41页
    4.3 数据分段算法第41-44页
        4.3.1 Round-Robin算法第41-42页
        4.3.2 CMD算法第42页
        4.3.3 基于关键维的类CMD和Round-Robin结合数据分段算法第42-43页
        4.3.4 算法分析第43-44页
    4.4 数据分配算法第44-47页
        4.4.1 聚类算法第44-45页
        4.4.2 数据在类间的分配算法第45页
        4.4.3 算法分析第45-47页
第5章 原型系统的设计与实现第47-55页
    5.1 架构设计第47-49页
        5.1.1 系统结构和数据流第47-48页
        5.1.2 系统分层架构和重要模块第48-49页
    5.2 底层模块设计第49-51页
        5.2.1 远程过程调用第49页
        5.2.2 持久化第49-50页
        5.2.3 配置管理第50页
        5.2.4 日志管理第50-51页
    5.3 管理节点的设计与实现第51页
        5.3.1 数据导入第51页
    5.4 元数据服务器的设计与实现第51-55页
        5.4.1 Dimension元数据服务器第52-53页
        5.4.2 Cube元数据服务器第53-55页
第6章 系统运行测试与分析第55-69页
    6.1 系统测试第55-56页
        6.1.1 硬件环境第55页
        6.1.2 软件环境第55页
        6.1.3 测试用例第55-56页
    6.2 数据集成策略第56-64页
        6.2.1 实验设计第56-58页
        6.2.2 结果和分析第58-64页
    6.3 数据布局算法第64-69页
        6.3.1 实验设计第64-65页
        6.3.2 结果和分析第65-69页
第7章 总结和展望第69-71页
    7.1 总结第69页
    7.2 展望第69-71页
参考文献第71-75页
致谢第75页

论文共75页,点击 下载论文
上一篇:3D数据中心虚拟机房子系统的设计与实现
下一篇:结构光与被动光相融合的快速三维测量技术研究