摘要 | 第5-6页 |
ABSTRACT | 第6-7页 |
第一章 绪论 | 第11-14页 |
1.1 课题研究背景 | 第11-12页 |
1.2 国内外研究现状 | 第12-13页 |
1.3 论文结构 | 第13-14页 |
第二章 分布式文件系统的数据分析与管理 | 第14-36页 |
2.1 HDFS介绍 | 第14-18页 |
2.1.1 HDFS的设计目标 | 第14-15页 |
2.1.2 HDFS的基本概念 | 第15-18页 |
2.2 HDFS集群信息采集系统 | 第18-24页 |
2.2.1 数据的拓扑信息采集 | 第18-19页 |
2.2.2 文件详情信息的采集 | 第19-20页 |
2.2.3 文件使用信息的采集 | 第20-21页 |
2.2.4 集群信息采集系统 | 第21-24页 |
2.3 HDFS的文件与数据块关联分析 | 第24-30页 |
2.3.1 文件整体分析 | 第24-28页 |
2.3.2 文件详细分析 | 第28-29页 |
2.3.3 文件使用分析 | 第29-30页 |
2.4 HDFS的文件检索与管理系统 | 第30-35页 |
2.4.1 系统设计 | 第30页 |
2.4.2 文件检索模块 | 第30-33页 |
2.4.3 文件概览模块 | 第33-35页 |
2.5 本章小结 | 第35-36页 |
第三章 大规模网络数据环境下分布式文件系统的小文件研究 | 第36-54页 |
3.1 HDFS的内存结构及读取文件机制 | 第36-40页 |
3.1.1 HDFS的内存结构 | 第36-38页 |
3.1.2 HDFS的读文件机制 | 第38-39页 |
3.1.3 HDFS的写文件机制 | 第39-40页 |
3.2 集群小文件分析 | 第40-42页 |
3.2.1 小文件分布分析 | 第40页 |
3.2.2 文件夹分布分析 | 第40-41页 |
3.2.3 小文件详细分析 | 第41-42页 |
3.3 HDFS小文件与系统性能关系研究 | 第42-45页 |
3.3.1 小文件过多对集群影响的理论分析 | 第42-43页 |
3.3.2 课题实验环境配置 | 第43页 |
3.3.3 作业运行影响研究 | 第43-44页 |
3.3.4 文件上传影响研究 | 第44-45页 |
3.3.5 小文件对集群影响研究总结 | 第45页 |
3.4 HDFS碎片整理系统 | 第45-53页 |
3.4.1 合并小文件的方式概述 | 第45-47页 |
3.4.2 系统设计与实现 | 第47-53页 |
3.5 本章小结 | 第53-54页 |
第四章 大规模网络数据环境下分布式文件系统的数据均衡研究 | 第54-66页 |
4.1 HDFS的数据均衡策略 | 第54-57页 |
4.1.1 HDFS的副本放置策略 | 第54-55页 |
4.1.2 HDFS的数据均衡策略 | 第55-57页 |
4.2 分布式文件系统数据分布研究 | 第57-59页 |
4.2.1 文件块分布分析 | 第57-58页 |
4.2.2 文件不均衡度分布分析 | 第58页 |
4.2.3 热点文件分布分析 | 第58-59页 |
4.3 HDFS数据分布不均衡对集群影响的研究 | 第59-63页 |
4.3.1 MapReduce流程介绍 | 第59-61页 |
4.3.2 数据不均衡对集群影响的理论分析 | 第61-62页 |
4.3.3 HDFS数据分布不均衡对集群影响的测试 | 第62-63页 |
4.4 HDFS的数据均衡策略改进 | 第63-65页 |
4.4.1 基于多衡量指标的数据均衡策略 | 第63-64页 |
4.4.2 基于多衡量指标的数据均衡策略的优缺点 | 第64页 |
4.4.3 基于多衡量指标的数据均衡策略的性能验证 | 第64-65页 |
4.5 本章小结 | 第65-66页 |
第五章 HDFS权限管理系统 | 第66-75页 |
5.1 HDFS的安全机制 | 第66页 |
5.2 通用的权限管理系统 | 第66-70页 |
5.2.1 安全权限相关知识 | 第66-69页 |
5.2.2 权限管理系统实现 | 第69-70页 |
5.3 命令行端的HDFS权限管理系统 | 第70-72页 |
5.4 Web端的HDFS权限管理系统 | 第72-74页 |
5.5 本章小结 | 第74-75页 |
第六章 总结与展望 | 第75-76页 |
参考文献 | 第76-78页 |
致谢 | 第78-79页 |
攻读学位期间发表的学术论文目录 | 第79页 |