教育部数据中心数据管理优化策略研究
致谢 | 第4-5页 |
摘要 | 第5-6页 |
Abstract | 第6页 |
1 引言 | 第9-16页 |
2 文献综述 | 第16-48页 |
2.1 教育数据中心数据管理与大数据分析问题 | 第16-25页 |
2.1.1 大数据分析的发展阶段 | 第16-18页 |
2.1.2 大数据分析研究关注的问题 | 第18-22页 |
2.1.3 教育部数据中心数据管理的特点 | 第22-25页 |
2.2 教育数据管理中的关键技术 | 第25-47页 |
2.2.1 列存储技术 | 第25-31页 |
2.2.2 并行处理技术 | 第31-37页 |
2.2.3 分布式处理技术 | 第37-46页 |
2.2.4 教育数据管理的现存问题 | 第46-47页 |
2.3 本章小结 | 第47-48页 |
3 基于列存储的教育数据存储成本优化 | 第48-75页 |
3.1 教育数据存储管理成本分析 | 第48-51页 |
3.2 分布式无共享集群网络架构 | 第51-52页 |
3.3 基于列存储的教育数据存储模型 | 第52-64页 |
3.3.1 基于相关性的列组合聚类 | 第53-57页 |
3.3.2 列组合存储配置模型 | 第57-61页 |
3.3.3 模型中参数的讨论和确定 | 第61-64页 |
3.4 最小存储成本策略 | 第64-68页 |
3.4.1 经验与实时并行策略 | 第64-65页 |
3.4.2 副本的临时部署 | 第65-66页 |
3.4.3 MCSP的基本步骤 | 第66-68页 |
3.5 实验分析 | 第68-74页 |
3.6 本章小结 | 第74-75页 |
4 教育数据分析的分布式任务调度优化 | 第75-94页 |
4.1 教育数据调度问题 | 第75-76页 |
4.2 数据分析查询任务的量化 | 第76-80页 |
4.2.1 数据分析复杂度 | 第76-79页 |
4.2.2 任务优先级 | 第79页 |
4.2.3 综合效用系数 | 第79-80页 |
4.3 基于综合效用的教育数据调度模型 | 第80-82页 |
4.3.1 模型建立 | 第80-81页 |
4.3.2 模型求解 | 第81-82页 |
4.4 基于系统整体负载率的任务调度优化 | 第82-88页 |
4.4.1 系统整体负载率 | 第82-83页 |
4.4.2 超载情况下的查询需求调整 | 第83-84页 |
4.4.3 增添节点策略 | 第84-85页 |
4.4.4 查询需求调度策略 | 第85-88页 |
4.5 实验分析 | 第88-92页 |
4.6 本章小结 | 第92-94页 |
5 数据资源容错部署优化 | 第94-117页 |
5.1 教育数据存储与分析系统的容错问题 | 第94-96页 |
5.2 列组合数据的选择性恢复策略 | 第96-98页 |
5.2.1 数据的重要性度量 | 第97页 |
5.2.2 恢复节点的选择 | 第97-98页 |
5.2.3 数据选择性恢复策略 | 第98页 |
5.3 节点故障情况下的资源优化部署模型 | 第98-101页 |
5.3.1 模型建立 | 第99-100页 |
5.3.2 模型参数的确定 | 第100-101页 |
5.4 节点故障下的资源优化部署策略 | 第101-108页 |
5.4.1 节点故障恢复策略 | 第102-103页 |
5.4.2 节点故障下的查询需求临时调度策略 | 第103-108页 |
5.5 数据中心运维保障 | 第108-112页 |
5.5.1 数据中心运维服务体系 | 第108-111页 |
5.5.2 信息安全保障 | 第111-112页 |
5.6 实验分析 | 第112-116页 |
5.7 本章小结 | 第116-117页 |
6 结论 | 第117-119页 |
参考文献 | 第119-129页 |
作者简历及在学研究成果 | 第129-132页 |
学位论文数据集 | 第132页 |