首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--存贮器论文

基于MapFile的HDFS小文件存取优化研究

摘要第3-5页
abstract第5-6页
第1章 绪论第9-14页
    1.1 研究背景第9-10页
    1.2 研究现状第10-11页
        1.2.1 HDFS小文件存取问题第10页
        1.2.2 国内外研究现状第10-11页
    1.3 研究内容第11-12页
    1.4 本文结构第12-14页
第2章 相关研究第14-23页
    2.1 分布式文件系统HDFS第14-19页
        2.1.1 HDFS基本概念第14-16页
        2.1.2 HDFS存储文件流程第16-18页
        2.1.3 HDFS读取文件流程第18-19页
    2.2 MapReduce编程模型第19-21页
    2.3 本章小结第21-23页
第3章 存取优化方案的设计第23-33页
    3.1 HDFS存取海量小文件问题第23-24页
    3.2 Hadoop小文件容器第24-25页
        3.2.1 SequenceFile第24页
        3.2.2 MapFile第24-25页
    3.3 缓存技术第25-31页
        3.3.1 多级缓存第26-27页
        3.3.2 缓存穿透第27-28页
        3.3.3 LRU算法和LRU-K算法第28-31页
    3.4 文件访问因子第31-32页
    3.5 本章小结第32-33页
第4章 存取优化方案的实现第33-44页
    4.1 优化方案总体实现第33-34页
    4.2 海量小文件读取优化实现第34-38页
        4.2.1 缓存模块第35-36页
        4.2.2 Nexit文件缓冲区域第36-37页
        4.2.3 缓存更新策略第37-38页
    4.3 海量小文件存储优化实现第38-41页
    4.4 小文件存取优化的量化分析第41-43页
        4.4.1 NameNode内存消耗第41-42页
        4.4.2 文件读取时间第42-43页
    4.5 本章小结第43-44页
第5章 测试与分析第44-54页
    5.1 实验设计第44页
    5.2 实验环境第44-47页
        5.2.1 集群搭建第44-45页
        5.2.2 参数配置第45-47页
    5.3 测试数据第47-48页
    5.4 存储阶段测试第48-50页
        5.4.1 存储执行时间测试第48-50页
        5.4.2 NameNode内存消耗第50页
    5.5 读取阶段测试第50-54页
        5.5.1 无不存在文件读取第50-52页
        5.5.2 有不存在文件读取第52-54页
第6章 总结和展望第54-56页
    6.1 总结第54-55页
    6.2 展望第55-56页
致谢第56-57页
参考文献第57-60页
攻读学位期间的研究成果第60页

论文共60页,点击 下载论文
上一篇:面向栅格化分布式水文模拟的并行调度方法研究
下一篇:基于博弈论的电力市场多方交易策略研究