摘要 | 第3-4页 |
abstract | 第4-5页 |
1 绪论 | 第8-14页 |
1.1 研究背景与意义 | 第8-9页 |
1.2 国内外研究现状 | 第9-11页 |
1.2.1 校园数据挖掘领域研究现状 | 第9-10页 |
1.2.2 大数据处理技术研究现状 | 第10-11页 |
1.3 论文研究内容及组织结构 | 第11-12页 |
1.3.1 论文研究内容 | 第11-12页 |
1.3.2 本文组织结构 | 第12页 |
1.4 本章小结 | 第12-14页 |
2 基于校园大数据的学生行为分析与预测平台结构 | 第14-26页 |
2.1 系统工作流程 | 第14-15页 |
2.2 学生行为分析与预测平台结构 | 第15-16页 |
2.3 数据集成与预处理 | 第16页 |
2.4 学生“画像”特征库构建 | 第16-19页 |
2.5 相关技术 | 第19-24页 |
2.5.1 大数据技术 | 第19-23页 |
2.5.2 聚类分析方法 | 第23-24页 |
2.6 本章小结 | 第24-26页 |
3 基于聚类分析的学生行为细分方法 | 第26-46页 |
3.1 学生行为细分需求 | 第26页 |
3.2 学生行为描述指标 | 第26-28页 |
3.3 基于密度优化K-means算法 | 第28-34页 |
3.3.1 K-means算法 | 第28-30页 |
3.3.2 基于密度优化的K-means算法 | 第30-34页 |
3.4 基于密度优化的K-means并行化实现 | 第34-39页 |
3.5 实验结果与分析 | 第39-45页 |
3.6 本章小结 | 第45-46页 |
4 学生行为预测与预警方法 | 第46-66页 |
4.1 学生行为特征分层模型 | 第46-48页 |
4.2 学生行为预测与预警方法 | 第48-53页 |
4.2.1 K近邻非参数回归学生行为预测模型 | 第48-51页 |
4.2.2 基于决策树的学生行为预警 | 第51-53页 |
4.3 学生行为预测与预警方法的并行化 | 第53-59页 |
4.3.1 K近邻非参数回归预测算法的并行化 | 第53-55页 |
4.3.2 基于决策树的学生行为预警方法并行化 | 第55-59页 |
4.4 实验结果与分析 | 第59-65页 |
4.4.1 学生行为预测实验分析 | 第59-63页 |
4.4.2 学生行为预警实验分析 | 第63-65页 |
4.5 本章小结 | 第65-66页 |
5 基于Spark的学生行为分析与预测平台实现 | 第66-88页 |
5.1 基于Spark的算法并行化理论 | 第66-70页 |
5.1.1 弹性分布式数据集 | 第66-69页 |
5.1.2 Spark SQL与DataFrame | 第69-70页 |
5.2 Spark分布式平台搭建 | 第70-73页 |
5.2.1 实验环境 | 第70-71页 |
5.2.2 平台搭建 | 第71-73页 |
5.3 基于Spark的学生行为分析与预测平台功能实现 | 第73-86页 |
5.3.1 概述 | 第73页 |
5.3.2 基于Spark的学生行为分析与预测平台功能结构 | 第73-86页 |
5.4 本章小结 | 第86-88页 |
6 总结与展望 | 第88-90页 |
6.1 本文工作总结 | 第88页 |
6.2 未来工作展望 | 第88-90页 |
致谢 | 第90-92页 |
参考文献 | 第92-96页 |
攻读硕士期间研究成果 | 第96页 |