首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Spark的海量数据计算平台设计与实现

摘要第4-5页
Abstract第5页
1 绪论第9-15页
    1.1 平台技术背景第9-11页
        1.1.1 海量数据计算技术背景第9-10页
        1.1.2 Webx框架技术背景第10-11页
    1.2 平台技术现状第11-13页
        1.2.1 Hadoop和Spark技术现状第11-12页
        1.2.2 Web框架技术现状第12-13页
        1.2.3 海量数据计算平台技术现状第13页
    1.3 本文的组织结构第13-14页
    1.4 本文的主要工作第14-15页
2 相关技术和工具第15-24页
    2.1 分布式计算框架Spark第15-18页
        2.1.1 分布式文件系统HDFS第15-16页
        2.1.2 弹性分布式数据集RDD第16-18页
        2.1.3 机器学习算法库MLlib第18页
    2.2 Webx技术原理第18-22页
        2.2.1 SpringExt第19-20页
        2.2.2 Webx Framework第20-22页
        2.2.3 Webx Turbine第22页
    2.3 Secure Shell第22-24页
3 需求分析第24-29页
    3.1 设计目标第24-25页
    3.2 功能需求第25-27页
        3.2.1 Spark图形化操作第26页
        3.2.2 海量数据存储管理第26页
        3.2.3 传统机器学习算法迁移第26页
        3.2.4 算法自定义第26页
        3.2.5 结果可视化分析第26页
        3.2.6 留言板反馈Bug第26-27页
    3.3 安全需求第27-28页
        3.3.1 权限机制第27页
        3.3.2 数据安全第27-28页
    3.4 性能需求第28页
        3.4.1 平台稳定性第28页
        3.4.2 平台处理速度第28页
    3.5 可行性分析第28-29页
4 平台设计第29-42页
    4.1 总体设计第29-31页
        4.1.1 平台处理流程第29-30页
        4.1.2 平台逻辑结构第30-31页
    4.2 平台功能模块设计第31-32页
    4.3 数据库设计第32-36页
        4.3.1 概念设计第32-33页
        4.3.2 逻辑视图第33-35页
        4.3.3 XML文档设计第35-36页
    4.4 详细设计第36-42页
        4.4.1 算法信息模块第36-37页
        4.4.2 海量数据存储模块第37-38页
        4.4.3 海量数据运算模块第38-40页
        4.4.4 可视化分析模块第40-42页
5 平台实现与测试第42-58页
    5.1 平台开发环境第42-43页
    5.2 平台实现第43-52页
        5.2.1 算法信息模块第43-46页
        5.2.2 海量数据存储模块第46-48页
        5.2.3 海量数据运算模块第48-51页
        5.2.4 可视化分析模块第51-52页
    5.3 平台测试第52-58页
        5.3.1 自定义算法测试第52-53页
        5.3.2 数据上传测试第53-54页
        5.3.3 算法运行测试第54-55页
        5.3.4 可视化分析测试第55-56页
        5.3.5 平台计算性能测试第56-58页
结论第58-60页
参考文献第60-62页
致谢第62-63页

论文共63页,点击 下载论文
上一篇:面向数据的软件工程方法探讨及初步应用
下一篇:基于激光点云与图像信息融合的三维场景重建