首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Hadoop的海量小文件处理技术研究

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第11-19页
    1.1 大数据的出现第11页
    1.2 云计算的出现第11-13页
    1.3 海量小文件的出现第13-14页
    1.4 海量小文件的处理第14-17页
        1.4.1 Hadoop处理小文件的问题第15页
        1.4.2 Hadoop小文件处理技术国内外研究现状第15-17页
    1.5 论文的研究内容与意义第17页
    1.6 论文的组织结构第17-19页
第二章 Hadoop关键技术研究第19-34页
    2.1 Hadoop简介第19页
    2.2 Hadoop的构造模块第19-21页
    2.3 HDFS分布式文件系统第21-26页
        2.3.1 NameNode名字节点第22-23页
        2.3.2 HDFS文件分块第23页
        2.3.3 DataNode数据节点第23-24页
        2.3.4 Client客户端第24页
        2.3.5 HDFS文件读取第24-26页
    2.4 MapReduce并行计算模型第26-28页
        2.4.1 JobTracker作业跟踪节点第26页
        2.4.2 TaskTracker任务跟踪节点第26-27页
        2.4.3 MapReduce数据处理第27-28页
    2.5 Hadoop平台搭建第28-33页
        2.5.1 网络的搭建第29-30页
        2.5.2 软件的安装第30页
        2.5.3 集群的配置第30-33页
    2.6 本章小结第33-34页
第三章 基于多层索引的小文件读写策略及测试分析第34-60页
    3.1 合并小文件第35-36页
        3.1.1 合并算法第35-36页
        3.1.2 合并实现第36页
    3.2 自定义输入文件分片第36-38页
        3.2.1 MapReduce分片第36-37页
        3.2.2 自定义分片的实现第37-38页
    3.3 建立多层索引第38-51页
        3.3.1 索引预处理第39页
        3.3.2 全局索引的建立第39-42页
        3.3.3 Trie树第42-43页
        3.3.4 局部一级索引的建立第43-49页
        3.3.5 索引树的分裂第49-51页
        3.3.6 局部二级索引的建立第51页
    3.4 索引的传输与放置第51-52页
    3.5 Hadoop源代码改进第52-54页
        3.5.1 NameNode源代码改进第52-53页
        3.5.2 DataNode源代码改进第53-54页
    3.6 小文件读写策略测试验证与分析第54-59页
        3.6.1 测试数据来源第54页
        3.6.2 元数据占用内存测试第54-56页
        3.6.3 合并写入测试第56页
        3.6.4 文件访问测试第56-59页
        3.6.5 数据分析第59页
    3.7 本章小结第59-60页
第四章 基于缓存技术的小文件读取策略及测试分析第60-78页
    4.1 缓存技术第60-62页
    4.2 缓存管理算法第62-66页
        4.2.1 基于时间局部性的缓存管理算法第62页
        4.2.2 基于访问频率的缓存管理算法第62-63页
        4.2.3 Adaptive Replacement Cache算法第63-66页
    4.3 ARC算法的Java实现第66-69页
    4.4 改进的ARC算法第69-74页
        4.4.1 改进的思想第70-71页
        4.4.2 改进的实现第71-74页
    4.5 缓存预取技术的测试验证与分析第74-77页
        4.5.1 缓存使用测试第74-75页
        4.5.2 集中频繁访问测试第75-76页
        4.5.3 分散频繁访问测试第76页
        4.5.4 数据分析第76-77页
    4.6 本章小结第77-78页
第五章 总结与展望第78-80页
    5.1 总结第78页
    5.2 展望第78-80页
致谢第80-81页
参考文献第81-84页
攻读硕士学位期间取得的成果第84-85页

论文共85页,点击 下载论文
上一篇:汽车服务行业管理信息系统的设计与实现
下一篇:基于扫描笔的发票识别系统设计