首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--存贮器论文

基于Hadoop的海量小文件合并的研究与设计

摘要第5-6页
ABSTRACT第6页
1 绪论第9-14页
    1.1 研究背景第9-10页
        1.1.1 大数据时代第9页
        1.1.2 Hadoop—大数据处理框架第9-10页
        1.1.3 HDFS存储海量小文件的问题第10页
    1.2 国内外研究现状第10-12页
    1.3 主要工作与创新点第12页
    1.4 论文的组织结构第12-14页
2 分布式文件系统HDFS与存储海量小文件的研究第14-21页
    2.1 分布式集群Hadoop第14页
    2.2 分布式文件系统HDFS第14-16页
        2.2.1 数据块第14-15页
        2.2.2 namenode第15页
        2.2.3 datanode第15-16页
        2.2.4 HDFS的容错机制第16页
    2.3 HDFS存储海量小文件的研究第16-20页
        2.3.1 小文件的定义第16-17页
        2.3.2 存储海量小文件的问题第17-18页
        2.3.3 处理小文件问题的工具第18-20页
    2.4 本章小结第20-21页
3 系统SHDFS的关联文件合并模块的细化设计第21-33页
    3.1 SHDFS系统设计的目标第21页
    3.2 系统整体架构第21-22页
    3.3 关联文件挖掘模型第22-26页
        3.3.1 基于用户的最近邻推荐思想第22-24页
        3.3.2 数据预处理技术—K最近邻算法第24-25页
        3.3.3 模型关键算法实现第25-26页
    3.4 关联文件合并操作第26-28页
    3.5 实验与分析第28-32页
        3.5.1 实验环境第28页
        3.5.2 实验结果第28-32页
    3.6 本章小结第32-33页
4 系统SHDFS的热点文件缓存模块的细化设计第33-45页
    4.1 热点文件缓存第33-34页
    4.2 热点文件预测模型第34-37页
        4.2.1 数据聚类特性第34-36页
        4.2.2 对数线性算法第36-37页
    4.3 HBase技术第37页
    4.4 缓存模块算法实现第37-39页
        4.4.1 筛选活跃用户第38页
        4.4.2 预测热点文件第38页
        4.4.3 HBase缓存热点文件第38-39页
    4.5 缓存模块中的文件读写流程第39-41页
        4.5.1 文件的读取流程第39-40页
        4.5.2 文件的写入流程第40-41页
    4.6 实验与分析第41-44页
        4.6.1 实验环境第41-42页
        4.6.2 实验结果第42-44页
    4.7 本章小结第44-45页
5 总结与展望第45-47页
    5.1 总结第45页
    5.2 展望第45-47页
参考文献第47-51页
图和附表清单第51-52页
致谢第52-53页
攻读硕士学位期间取得的研究成果第53-54页
学位论文数据集表第54-55页

论文共55页,点击 下载论文
上一篇:基于GPRS与物联网的广告屏系统设计与实现
下一篇:临床医学诊断思维训练系统的研究与实现