首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于YARN的数据挖掘系统的设计与实现

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第9-14页
    1.1 研究背景第9-11页
    1.2 研究内容第11-12页
    1.3 本文结构第12-14页
第二章 相关技术介绍第14-33页
    2.1 数据挖掘第14-15页
    2.2 开源云计算技术第15-32页
        2.2.1 Hadoop1.0第16-19页
        2.2.2 YARN(Hadoop2.0)第19-23页
        2.2.3 Spark生态系统第23-30页
        2.2.4 Storm实时数据处理技术第30-32页
    2.3 本章小结第32-33页
第三章 多计算框架分析与对比第33-47页
    3.1 开源计算框架对比第33-43页
        3.1.1 Hadoop1.0与YARN第33-35页
        3.1.2 Hadoop生态与Spark生态第35-40页
        3.1.3 YARN与其他资源管理框架第40-41页
        3.1.4 Storm在流式计算中的优势第41-43页
    3.2 云平台搭建第43-46页
        3.2.1 Hadoop安装配置第43-45页
        3.2.2 Spark安装配置第45页
        3.2.3 Storm安装配置第45-46页
    3.3 本章小结第46-47页
第四章 基于YARN的数据挖掘系统的架构设计与实现第47-72页
    4.1 系统架构设计第47-52页
        4.1.1 系统整体架构设计第47-49页
        4.1.2 系统云平台层设计第49-52页
    4.2 已有PDM系统向YARN迁移第52-57页
        4.2.1 Hadoop2.0向后兼容性研究第52-56页
        4.2.2 系统向YARN迁移第56-57页
    4.3 典型数据挖掘算法多框架实现第57-70页
        4.3.1 k均值算法第58-61页
        4.3.2 逻辑回归算法第61-63页
        4.3.3 决策树算法第63-67页
        4.3.4 朴素贝叶斯算法第67-70页
    4.4 PDM平台Spark算法组件的集成第70-71页
    4.5 本章小结第71-72页
第五章 实验及结果分析第72-90页
    5.1 PDM平台功能性测试第72-79页
        5.1.1 系统整体性功能测试第72-73页
        5.1.2 Hadoop参数调优工具测试第73-75页
        5.1.3 Spark算法组件测试第75-79页
    5.2 云平台层性能测试第79-86页
        5.2.1 C4.5决策树算法性能对比第80-84页
        5.2.2 k均值算法性能对比第84-85页
        5.2.3 MapReduce、Spark性能对比总结第85-86页
    5.3 实时系统性能监控与测试第86-89页
    5.4 本章小结第89-90页
第六章 总结与展望第90-91页
参考文献第91-93页
致谢第93-94页
攻读学位期间发表的学术论文第94页

论文共94页,点击 下载论文
上一篇:基于SaaS的监控系统的设计与实现
下一篇:媒体监督、在职消费与高管薪酬业绩敏感性研究