首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--存贮器论文

基于数据属性的大数据存储系统研究与实现

摘要第5-6页
ABSTRACT第6页
第一章 绪论第9-14页
    1.1 研究背景第9-10页
    1.2 研究现状第10-12页
    1.3 本文主要工作内容第12-13页
    1.4 本文组织结构第13-14页
第二章 相关技术介绍第14-27页
    2.1 主流分布式文件系统概述第14-17页
        2.1.1 moose FS第14-15页
        2.1.2 mogilefs第15-16页
        2.1.3 Fast DFS第16-17页
        2.1.4 HDFS第17页
    2.2 FASTDFS文件系统概述第17-20页
    2.3 HADOOP分布式处理框架第20-25页
        2.3.1 Hadoop分布式文件系统第20-23页
        2.3.2 Map Reduce编程模型第23-25页
    2.4 MONGODB NOSQL数据库概述第25-26页
    2.5 本章小结第26-27页
第三章 需求分析和数据逻辑模型第27-34页
    3.1 系统需求分析第27-29页
        3.1.1 传统数据处理软件难以满足大数据的需求第27页
        3.1.2 对外提供统一的服务接.需求第27-28页
        3.1.3 统一的数据逻辑模型需求第28-29页
    3.2 大数据存储逻辑模型第29-33页
        3.2.1 基于属性向量的统一数据模型的提出第29-31页
        3.2.2 基于属性向量的统一数据模型的实现第31-33页
    3.3 本章小结第33-34页
第四章 系统设计和实现第34-54页
    4.1 系统总体架构第34-35页
    4.2 系统流程介绍第35-40页
        4.2.1 系统启动流程第35-37页
        4.2.2 数据文件入库第37-38页
        4.2.3 数据文件删除第38-39页
        4.2.4 数据查询和文件读取第39-40页
    4.3 文件级重复数据删除第40-46页
        4.3.1 重复数据删除技术介绍第40-42页
        4.3.2 重复数据删除在本系统中的实现第42-46页
    4.4 MONGODB分片和负载均衡算法优化第46-49页
        4.4.1 Mongo DB自分片架构第46-47页
        4.4.2 基于热度的负载均衡算法第47-48页
        4.4.3 基于热度的负载均衡算法在Mongo DB中的运用第48-49页
    4.5 系统中并行化的应用第49-53页
        4.5.1 Fast DFS中文件属性提取并行化的实现第50-53页
    4.6 本章小结第53-54页
第五章 实验测试与分析第54-62页
    5.1 实验环境部署第54-55页
    5.2 数据文件入库性能实验第55-58页
    5.3 文件入库到FASTDFS的并行属性提取和串行属性提取性能对比第58-60页
    5.4 文件查询性能测试第60页
    5.5 本章小结第60-62页
总结与展望第62-63页
参考文献第63-66页
攻读硕士学位期间取得的研究成果第66-67页
致谢第67-68页
附件第68页

论文共68页,点击 下载论文
上一篇:基于视觉识别的鲜烟叶分拣系统的研究
下一篇:适配海量小文件的分布式文件系统关键技术研究及系统实现