首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于云平台的机器学习算法并行化研究与应用

中文摘要第4-6页
ABSTRACT第6-7页
第一章 引言第10-16页
    1.1 研究背景和意义第10-12页
    1.2 国内外研究现状第12-14页
        1.2.1 基因数据分析研究现状第12-13页
        1.2.2 云平台下的数据挖掘现状第13-14页
    1.3 内容安排第14-16页
第二章 相关技术第16-23页
    2.1 云平台介绍第16-22页
        2.1.1 MapReduce框架第17-18页
        2.1.2 HDFS存储第18-19页
        2.1.3 Mahout技术第19-21页
        2.1.4 Spark技术第21-22页
    2.2 生物信息学第22-23页
第三章 算法分析第23-32页
    3.1 聚类分析第23-25页
        3.1.1 聚类算法第23-24页
        3.1.2 K-means聚类第24-25页
    3.2 分类分析第25-28页
        3.2.1 决策树算法分析第26-28页
        3.2.2 随机森林算法分析第28页
    3.3 度量计算分析第28-32页
        3.3.1 欧式距离第28-29页
        3.3.2 皮尔森相关系数第29页
        3.3.3 余弦相似度第29-30页
        3.3.4 信息增益的计算方式第30页
        3.3.5 评估方式第30-32页
第四章 基于Spark+Hadoop的算法设计第32-41页
    4.1 Spark内核架构基本原理第32-34页
    4.2 并行聚类在Spark+Hadoop平台上的实现第34-36页
        4.2.1 聚类中心点的选取第34-35页
        4.2.2 并行K-means的具体执行过程第35-36页
    4.3 并行分类在Spark+Hadoop平台上的实现第36-40页
        4.3.1 树节点的选取划分第37页
        4.3.2 随机森林的具体执行过程第37-40页
    4.4 基于Spark算法分析总结第40-41页
第五章 基于Spark+Hadoop的结果分析第41-45页
    5.1 实验环境的搭建第41页
    5.2 实验过程及其结果第41-45页
        5.2.1 实验数据第41-43页
        5.2.2 实验分析第43-45页
第六章 总结与展望第45-47页
    6.1 工作总结第45-46页
    6.2 工作展望第46-47页
参考文献第47-50页
致谢第50-51页
攻读学位期间发表的论文及参与项目第51页

论文共51页,点击 下载论文
上一篇:耀州窑陶瓷艺术三维虚拟展示设计研究
下一篇:油气SCADA信息安全与攻防靶场的研究与实现