Hadoop小文件处理方法的研究与实现

摘要	第5-6页
ABSTRACT	第6-7页
缩略语对照表	第10-13页
第一章绪论	第13-21页
1.1 研究背景	第13-18页
1.1.1 数据时代的来临	第13-14页
1.1.2 大数据	第14-15页
1.1.3 Hadoop的出现	第15-17页
1.1.4 HDFS的不足	第17-18页
1.2 相关工作	第18-20页
1.3 研究目的	第20页
1.4 论文安排	第20-21页
第二章相关知识	第21-33页
2.1 Hadoop平台	第21页
2.2 分布式文件系统HDFS	第21-26页
2.2.1 名称节点	第21页
2.2.2 数据节点	第21-22页
2.2.3 数据块	第22-23页
2.2.4 HDFS文件读/写	第23-26页
2.3 小文件问题分析	第26-28页
2.4 小文件的阈值选择	第28-30页
2.5 B+树索引	第30-31页
2.6 散列表索引	第31-32页
2.7 本章小节	第32-33页
第三章小文件处理方案设计思想	第33-49页
3.1 文件合并	第33-34页
3.2 索引/数据预取	第34-35页
3.3 文件索引	第35-36页
3.4 整体流程	第36-39页
3.4.1 写文件	第36-37页
3.4.2 读文件	第37-38页
3.4.3 删除文件	第38-39页
3.5 原B+树算法	第39-46页
3.6 改进后B+树操作算法	第46-48页
3.7 本章小结	第48-49页
第四章各部分功能设计	第49-53页
4.1 文件处理模块	第49页
4.2 名称节点索引部分	第49-51页
4.3 客户端索引预取部分	第51-52页
4.4 客户端文件预取部分	第52页
4.5 本章小结	第52-53页
第五章实验及结果分析	第53-57页
5.1 测试环境	第53-54页
5.2 测试准备	第54页
5.2.1 测试方法	第54页
5.2.2 测试集	第54页
5.3 测试结果	第54-56页
5.4 测试分析	第56页
5.5 本章小结	第56-57页
第六章总结与展望	第57-59页
6.1 本文小结	第57页
6.2 展望	第57-59页
参考文献	第59-63页
致谢	第63-65页
作者简介	第65-66页