摘要 | 第4-5页 |
ABSTRACT | 第5页 |
第一章 绪论 | 第8-16页 |
1.1 研究背景及意义 | 第8-9页 |
1.1.1 研究背景 | 第8-9页 |
1.1.2 研究意义 | 第9页 |
1.2 研究现状 | 第9-13页 |
1.2.1 大数据研究现状 | 第9-11页 |
1.2.2 MapReduce技术使用现状 | 第11-12页 |
1.2.3 数据挖掘算法研究现状 | 第12-13页 |
1.3 主要研究内容 | 第13-14页 |
1.4 论文结构 | 第14-16页 |
第二章 高校大数据分析挖掘相关方法与技术 | 第16-28页 |
2.1 数据挖掘相关理论与方法 | 第16-23页 |
2.1.1 数据挖掘的概念 | 第16页 |
2.1.2 数据挖掘基本步骤 | 第16-19页 |
2.1.3 常用数据挖掘方法 | 第19-23页 |
2.2 Hadoop技术 | 第23-28页 |
2.2.1 Hadopp2.0 总体构架 | 第23-24页 |
2.2.2 Hadoop中的MapReduce计算模型 | 第24-28页 |
第三章 基于MapReduce的Apriori关联规则算法的改进及分析 | 第28-44页 |
3.1 关联规则相关概念 | 第28-29页 |
3.2 Apriori关联规则算法 | 第29-33页 |
3.2.1 算法基本思想 | 第29页 |
3.2.2 学生成绩模块中的Apriori关联规则算法 | 第29-33页 |
3.3 基于MapReduce的Apriori关联规则算法 | 第33-38页 |
3.4 基于MapReduce的Apriori最小支持度阈值算法 | 第38-42页 |
3.4.1 改进的算法思想 | 第38-39页 |
3.4.2 实例分析 | 第39-42页 |
3.5 实验结果及分析 | 第42-44页 |
第四章 基于MapReduce的C4.5 决策树算法的改进及分析 | 第44-54页 |
4.1 决策树相关概念 | 第44-45页 |
4.1.1 决策树基本算法 | 第44-45页 |
4.1.2 信息熵相关概念 | 第45页 |
4.2 C4.5 算法 | 第45-51页 |
4.2.1 算法基本思想 | 第46页 |
4.2.2 学生助学金模块中的C4.5 分类算法 | 第46-51页 |
4.3 基于MapReduce的C4.5 交叉分块算法 | 第51-53页 |
4.4 实验结果及分析 | 第53-54页 |
第五章 高校大数据分析挖掘系统设计 | 第54-68页 |
5.1 系统总体构架 | 第54-55页 |
5.2 系统功能模块分析 | 第55-59页 |
5.2.1 数据挖掘分析系统框架 | 第55-56页 |
5.2.2 专题分析模块 | 第56-59页 |
5.3 数据存储设计 | 第59-68页 |
5.3.1 结构化数据存储设计 | 第59-63页 |
5.3.2 非结构化数据存储设计 | 第63-68页 |
第六章 总结与展望 | 第68-70页 |
6.1 工作总结 | 第68页 |
6.2 展望 | 第68-70页 |
参考文献 | 第70-74页 |
致谢 | 第74-76页 |
攻读学位期间的科研成果 | 第76-77页 |