首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于Hadoop的在线数据挖掘系统的设计与实现

摘要第5-6页
ABSTRACT第6页
第一章 绪论第10-15页
    1.1 研究工作的背景与意义第10-12页
    1.2 国内外研究现状第12-14页
    1.3 本文主要贡献与创新第14页
    1.4 论文组织结构第14-15页
第二章 系统相关技术介绍第15-22页
    2.1 相关技术总述第15-16页
    2.2 分布式文件系统HDFS技术第16-17页
    2.3 分布式计算框架MapReduce简介第17-18页
    2.4 数据仓库Hive简介第18-19页
    2.5 内存计算框架Spark简介第19-20页
    2.6 机器学习Mahout/MLlib简介第20-21页
    2.7 本章小结第21-22页
第三章 系统需求分析第22-28页
    3.1 整体需求分析第22-23页
    3.2 系统功能需求第23-25页
        3.2.1 系统交互第24页
        3.2.2 算子库第24-25页
        3.2.3 执行引擎第25页
        3.2.4 大数据基础平台第25页
    3.3 系统软硬件环境需求第25-27页
        3.3.1 工作流调度端软硬件需求第26页
            3.3.1.1 硬件环境需求第26页
            3.3.1.2 软件环境需求第26页
        3.3.2 Hadoop平台软硬件需求第26-27页
            3.3.2.1 硬件环境需求第26页
            3.3.2.2 软件环境需求第26-27页
    3.4 本章小结第27-28页
第四章 系统设计与实现第28-68页
    4.1 系统体系结构第29-31页
    4.2 Web端设计第31-33页
    4.3 系统核心层设计第33-65页
        4.3.1 算子库的设计第35-42页
            4.3.1.1 算子功能设计依据第35-37页
            4.3.1.2 算子架构设计第37-39页
            4.3.1.3 算子实现第39-40页
            4.3.1.4 算法集成第40-42页
        4.3.2 工作流引擎设计第42-65页
            4.3.2.1 工作流描述设计第42-45页
            4.3.2.2 工作流服务架构设计第45-47页
            4.3.2.3 工作流创建流程第47-50页
            4.3.2.4 工作流元数据管理设计第50-51页
            4.3.2.5 工作流数据管理模块设计第51-52页
            4.3.2.6 工作流状态机第52-54页
            4.3.2.7 工作流执行模块设计第54-59页
            4.3.2.8 算子执行服务设计第59-65页
    4.4 Hadoop平台设计第65-67页
    4.5 本章小结第67-68页
第五章 系统测试第68-80页
    5.1 测试环境第68-70页
        5.1.1 硬件环境第68-69页
        5.1.2 软件环境第69-70页
    5.2 功能测试第70-75页
        5.2.1 测试用例第70-71页
        5.2.2 测试图示第71-75页
            5.2.2.1 数据上传功能图示第71页
            5.2.2.2 工作流创建功能图示第71-73页
            5.2.2.3 工作流运行功能图示第73-75页
    5.3 性能测试第75-78页
    5.4 本章小结第78-80页
第六章 总结与展望第80-82页
    6.1 总结第80页
    6.2 展望第80-82页
致谢第82-83页
参考文献第83-86页

论文共86页,点击 下载论文
上一篇:基于稀疏子空间的高维数据聚类关键技术研究与应用
下一篇:自然场景下的文本检测技术研究