首页--数理科学和化学论文--概率论与数理统计论文--数理统计论文

基于Spark的主成分分析和因子分析并行化的研究与实现

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第9-14页
    1.1 研究背景第9-10页
    1.2 研究现状第10-12页
        1.2.1 数据统计分析相关产品第10-11页
        1.2.2 主成分分析研究现状第11页
        1.2.3 因子分析研究现状第11-12页
    1.3 研究内容第12-13页
    1.4 论文组织结构第13-14页
第二章 课题相关技术介绍第14-20页
    2.1 大数据分析平台第14-16页
        2.1.1 Hadoop框架第14-15页
        2.1.2 Apache Spark第15-16页
    2.2 主成分分析和因子分析第16-18页
    2.3 本章小结第18-20页
第三章 基于Hadoop的数理统计功能集的设计与实现第20-39页
    3.1 常用统计量第20-23页
        3.1.1 常用统计量第20-21页
        3.1.2 MapReduce算法第21-23页
    3.2 单变量分析第23-25页
        3.2.1 单变量分析第23页
        3.2.2 MapReduce算法第23-25页
    3.3 多变量分析第25-27页
        3.3.1 多变量分析第25页
        3.3.2 MapReduce算法第25-27页
    3.4 假设检验第27-31页
        3.4.1 假设检验第27-28页
        3.4.2 MapReduce算法第28-31页
    3.5 自助法第31页
        3.5.1 自助法第31页
        3.5.2 MapReduce算法第31页
    3.6 实验第31-38页
    3.7 本章小结第38-39页
第四章 基于Spark的主成分分析与因子分析第39-64页
    4.1 主成分分析与因子分析的课题难点与创新点第39-55页
        4.1.1 相关系数矩阵第39-41页
        4.1.2 相关系数矩阵的特征值的求解第41-53页
        4.1.3 相关系数矩阵的特征向量的求解第53-55页
    4.2 主成分分析第55-57页
    4.3 因子分析第57-58页
    4.4 其他提高效率的方法第58-60页
        4.4.1 相关系数矩阵的压缩存储第58-59页
        4.4.2 Spark参数配置第59-60页
    4.5 实验与结果对比第60-63页
        4.5.1 实验环境第60页
        4.5.2 实验数据和参数第60页
        4.5.3 实验结果第60-63页
    4.6 本章小结第63-64页
第五章 BDAP并行数据挖掘系统的集成第64-74页
    5.1 BDAP并行数据挖掘系统第64-65页
    5.2 系统集成第65-70页
        5.2.1 数理统计功能集模块的集成设计第65-69页
        5.2.2 主成分分析模块的集成设计第69-70页
        5.2.3 因子分析模块的集成设计第70页
    5.3 参数配置界面以及结果展示第70-73页
    5.4 本章小结第73-74页
第六章 总结与展望第74-76页
    6.1 总结第74-75页
    6.2 展望第75-76页
参考文献第76-79页
致谢第79-80页
攻读学位期间所取得的研究成果第80页

论文共80页,点击 下载论文
上一篇:基于Spark的分类算法的研究与实现
下一篇:基于深度卷积神经网络和时空特征的视频重建研究