| 摘要 | 第3-4页 |
| abstract | 第4-5页 |
| 1 绪论 | 第8-14页 |
| 1.1 研究背景与意义 | 第8-9页 |
| 1.2 国内外研究现状 | 第9-11页 |
| 1.2.1 校园数据挖掘领域研究现状 | 第9-10页 |
| 1.2.2 大数据处理技术研究现状 | 第10-11页 |
| 1.3 论文研究内容及组织结构 | 第11-12页 |
| 1.3.1 论文研究内容 | 第11-12页 |
| 1.3.2 本文组织结构 | 第12页 |
| 1.4 本章小结 | 第12-14页 |
| 2 基于校园大数据的学生行为分析与预测平台结构 | 第14-26页 |
| 2.1 系统工作流程 | 第14-15页 |
| 2.2 学生行为分析与预测平台结构 | 第15-16页 |
| 2.3 数据集成与预处理 | 第16页 |
| 2.4 学生“画像”特征库构建 | 第16-19页 |
| 2.5 相关技术 | 第19-24页 |
| 2.5.1 大数据技术 | 第19-23页 |
| 2.5.2 聚类分析方法 | 第23-24页 |
| 2.6 本章小结 | 第24-26页 |
| 3 基于聚类分析的学生行为细分方法 | 第26-46页 |
| 3.1 学生行为细分需求 | 第26页 |
| 3.2 学生行为描述指标 | 第26-28页 |
| 3.3 基于密度优化K-means算法 | 第28-34页 |
| 3.3.1 K-means算法 | 第28-30页 |
| 3.3.2 基于密度优化的K-means算法 | 第30-34页 |
| 3.4 基于密度优化的K-means并行化实现 | 第34-39页 |
| 3.5 实验结果与分析 | 第39-45页 |
| 3.6 本章小结 | 第45-46页 |
| 4 学生行为预测与预警方法 | 第46-66页 |
| 4.1 学生行为特征分层模型 | 第46-48页 |
| 4.2 学生行为预测与预警方法 | 第48-53页 |
| 4.2.1 K近邻非参数回归学生行为预测模型 | 第48-51页 |
| 4.2.2 基于决策树的学生行为预警 | 第51-53页 |
| 4.3 学生行为预测与预警方法的并行化 | 第53-59页 |
| 4.3.1 K近邻非参数回归预测算法的并行化 | 第53-55页 |
| 4.3.2 基于决策树的学生行为预警方法并行化 | 第55-59页 |
| 4.4 实验结果与分析 | 第59-65页 |
| 4.4.1 学生行为预测实验分析 | 第59-63页 |
| 4.4.2 学生行为预警实验分析 | 第63-65页 |
| 4.5 本章小结 | 第65-66页 |
| 5 基于Spark的学生行为分析与预测平台实现 | 第66-88页 |
| 5.1 基于Spark的算法并行化理论 | 第66-70页 |
| 5.1.1 弹性分布式数据集 | 第66-69页 |
| 5.1.2 Spark SQL与DataFrame | 第69-70页 |
| 5.2 Spark分布式平台搭建 | 第70-73页 |
| 5.2.1 实验环境 | 第70-71页 |
| 5.2.2 平台搭建 | 第71-73页 |
| 5.3 基于Spark的学生行为分析与预测平台功能实现 | 第73-86页 |
| 5.3.1 概述 | 第73页 |
| 5.3.2 基于Spark的学生行为分析与预测平台功能结构 | 第73-86页 |
| 5.4 本章小结 | 第86-88页 |
| 6 总结与展望 | 第88-90页 |
| 6.1 本文工作总结 | 第88页 |
| 6.2 未来工作展望 | 第88-90页 |
| 致谢 | 第90-92页 |
| 参考文献 | 第92-96页 |
| 攻读硕士期间研究成果 | 第96页 |