首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Spark的基因数据聚类分析及可视化

摘要第5-6页
Abstract第6页
第一章 绪论第11-18页
    1.1 研究背景第11-12页
    1.2 国内外研究现状第12-16页
        1.2.1 国内研究现状第13-15页
        1.2.2 国外研究现状第15-16页
    1.3 研究内容第16-17页
    1.4 论文组织结构第17-18页
第二章 Spark系统环境搭建第18-29页
    2.1 整体架构第18-19页
    2.2 Hadoop架构第19-23页
        2.2.1 HDFS分布式文件系统第20-21页
        2.2.2 MapReduce分布式计算框架第21-22页
        2.2.3 YARN资源管理器第22-23页
    2.3 Spark架构第23-24页
        2.3.1 Spark SQL第24页
        2.3.2 Spark Streaming第24页
        2.3.3 MLib第24页
        2.3.4 GraphX第24页
    2.4 Spark开发环境搭建第24-29页
        2.4.1 硬件系统要求第25页
        2.4.2 构造Hadoop分布式集群第25-26页
        2.4.3 构造分布式Spark集群第26-27页
        2.4.4 配置Spark开发环境第27-29页
第三章 基因数据处理与可视化第29-36页
    3.1 基因数据来源第29-30页
    3.2 初步处理数据第30-31页
    3.3 SparkSQL处理数据第31-33页
        3.3.1 SparkSQL存储数据第31-32页
        3.3.2 SparkSQL查询数据第32页
        3.3.3 SparkSQL与Hive第32-33页
    3.4 SparkStreaming处理数据第33-36页
        3.4.1 架构与抽象第33-34页
        3.4.2 SparkStreaming与SparkSQL第34页
        3.4.3 数据可视化第34-36页
第四章 基因数据聚类分析第36-49页
    4.1 Spark MLlib第36-37页
        4.1.1 常用算法及优势第36-37页
    4.2 K均值聚类第37-42页
        4.2.1 聚类分析步骤第37-39页
        4.2.2 聚类分析结果第39-40页
        4.2.3 选择K值后聚类第40-42页
    4.3 高斯混合模型聚类第42-47页
        4.3.1 高斯分布与参数估计第43页
        4.3.2 高斯混合模型及EM算法第43-44页
        4.3.3 高斯混合模型聚类分析第44-47页
    4.4 实验总结第47-49页
        4.4.1 实验环境第47页
        4.4.2 数据分析第47-49页
第五章 实验结果展示第49-54页
    5.1 基因信息展示第49-50页
    5.2 基因数据可视化展示第50-51页
    5.3 K均值聚类结果第51-52页
    5.4 高斯混合模型聚类结果第52-54页
结论第54-56页
    工作总结第54页
    工作展望第54-56页
参考文献第56-59页
致谢第59页

论文共59页,点击 下载论文
上一篇:社交网络中话题检测与趋势分析及预测算法改进研究
下一篇:移动端Web浏览器HTTP流量注入分析