首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于spark的K近邻分类算法研究及应用

摘要第8-9页
ABSTRACT第9-10页
第1章 绪论第11-17页
    1.1 研究背景与意义第11-12页
        1.1.1 研究背景第11-12页
        1.1.2 研究意义第12页
    1.2 研究现状第12-13页
    1.3 研究内容及主要工作第13-14页
    1.4 论文结构安排第14页
    1.5 本文创新点第14-17页
第2章 大数据框架理论研究第17-37页
    2.1 Hadoop相关原理研究第17-22页
        2.1.1 HDFS的概念特性及工作机制第17-19页
        2.1.2 MapReduce原理剖析第19-20页
        2.1.3 YARN的工作机制第20-22页
    2.2 Spark相关原理研究第22-28页
        2.2.1 Spark生态系统第23页
        2.2.2 Spark RDD第23-24页
        2.2.3 Spark SQL第24页
        2.2.4 Spark Streaming第24-25页
        2.2.5 Spark MLlib第25-26页
        2.2.6 GraphX第26页
        2.2.7 Spark中的术语介绍第26-28页
    2.3 Spark平台的优化第28-36页
        2.3.1 Spark性能调优第28-30页
        2.3.2 JVM调优第30-31页
        2.3.3 Shuffle调优第31-33页
        2.3.4 算子调优第33-34页
        2.3.5 troubleshooting第34-36页
    2.4 本章小结第36-37页
第3章 K近邻分类算法的改进研究第37-45页
    3.1 数据挖掘及机器学习概述第37-38页
        3.1.1 数据挖掘概述第37页
        3.1.2 机器学习概述第37-38页
        3.1.3 数据挖掘与机器学习的关系第38页
    3.2 传统K近邻算法第38页
    3.3 改进K近邻算法第38-40页
    3.4 实验结果与分析第40-43页
    3.5 本章小结第43-45页
第4章 基于Spark平台改进的K近邻算法应用第45-55页
    4.1 Spark任务调度流程分析第45-46页
    4.2 算法并行化设计思想第46-49页
    4.3 实验结果与分析第49-54页
        4.3.1 Spark大数据平台的搭建步骤第49-51页
        4.3.2 实验数据第51-52页
        4.3.3 结果分析第52-54页
    4.4 本章小结第54-55页
第5章 针对数据倾斜问题对K近邻算法进行改进的研究第55-67页
    5.1 数据倾斜问题描述第55页
    5.2 数据倾斜解决方案第55-59页
    5.3 实验结果与分析第59-65页
    5.4 本章小结第65-67页
第6章 总结与展望第67-69页
参考文献第69-73页
致谢第73-75页
在学期间主要研究成果第75-78页
    一、发表学术论文第75页
    二、其他科研成果第75-78页

论文共78页,点击 下载论文
上一篇:大数据下关联和分类的研究及其部分实现
下一篇:基于视觉定位的并联机器人抓取技术研究