首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop的行列混合存储模型研究

摘要第3-6页
abstract第6-9页
第1章 绪论第17-30页
    1.1 研究背景第17-18页
    1.2 Hadoop简介和发展现状第18-27页
        1.2.1 Hadoop简介第18-20页
        1.2.2 MapReduce的特性和操作流程第20-21页
        1.2.3 MapReduce作业的定性分析第21-25页
        1.2.4 Hadoop/MapReduce框架的缺陷和限制第25-27页
    1.3 论文研究内容第27-29页
    1.4 论文组织结构第29-30页
第2章 一种Hadoop下的页式行列混合存储结构Page File第30-51页
    2.1 引言第30-31页
    2.2 相关定义和相关工作第31-35页
        2.2.1 行存储第32-33页
        2.2.2 列存储第33-34页
        2.2.3 混合存储第34-35页
    2.3 Hadoop下的页式行列混合存储结构PageFile第35-39页
        2.3.1 PageFile结构描述第36-37页
        2.3.2 段控制页的结构第37-38页
        2.3.3 数据页的结构第38-39页
    2.4 数据导入的实现第39-43页
        2.4.1 数据输入和Map函数第40页
        2.4.2 段的生成第40-41页
        2.4.3 数据目录结构第41-42页
        2.4.4 数据导入性能的定性分析第42-43页
    2.5 元组重构第43-45页
        2.5.1 元组重构的实现第44页
        2.5.2 单表查询的性能分析第44-45页
    2.6 实验评估第45-50页
        2.6.1 数据存储和导入性能的定量评估第45-48页
        2.6.2 单表查询性能的定量评估第48-50页
    2.7 本章小结第50-51页
第3章 基于Page File的相关索引技术研究第51-77页
    3.1 引言第51-52页
    3.2 相关工作第52-56页
        3.2.1 单机下的索引技术第52-53页
        3.2.2 Hadoop下的索引技术第53-54页
        3.2.3 RB+树索引第54-55页
        3.2.4 范围哈希索引第55-56页
    3.3 PageFile下的多RB+树索引第56-67页
        3.3.1 索引页的结构第57-58页
        3.3.2 多RB+树索引的创建第58-60页
        3.3.3 多RB+树索引的查询和性能分析第60-67页
    3.4 PageFile下的多范围哈希索引第67-71页
        3.4.1 哈希文件的结构第67-68页
        3.4.2 多范围哈希索引的创建第68-70页
        3.4.3 多范围哈希索引的查询和性能分析第70-71页
    3.5 实验评估第71-75页
        3.5.1 B+树索引的性能评估第72-73页
        3.5.2 多范围哈希索引的性能评估第73-74页
        3.5.3 查询性能的综合评估第74-75页
    3.6 本章小结第75-77页
第4章 基于Page File的多表连接查询优化技术研究第77-107页
    4.1 引言第77-78页
    4.2 相关工作第78-82页
        4.2.1 MapReduce下的两表连接优化算法第78-80页
        4.2.2 MapReduce下的多表连接优化算法第80-81页
        4.2.3 MapReduce下的中间结果重用技术第81-82页
    4.3 自适应多表连接优化策略AMJO第82-89页
        4.3.1 相关定义第82-86页
        4.3.2 AMJO的基本概述第86-87页
        4.3.3 混合连接优化策略的实现第87-89页
    4.4 查询执行计划第89-94页
        4.4.1 相关定义第90页
        4.4.2 代价估计第90-92页
        4.4.3 生成执行计划树第92-94页
    4.5 中间结果重用技术第94-101页
        4.5.1 相关定义第94-96页
        4.5.2 生成重用连接体第96-99页
        4.5.3 管理计算结果第99-101页
    4.6 实验评估第101-106页
        4.6.1 多表连接性能评估第102-104页
        4.6.2 中间结果重用性能评估第104-106页
    4.7 本章小结第106-107页
第5章 基于Page File的压缩技术研究第107-126页
    5.1 引言第107-108页
    5.2 相关工作第108-112页
        5.2.1 常用的轻量级压缩算法第108-110页
        5.2.2 MapReduce下的压缩技术研究第110-112页
    5.3 压缩数据的存储第112-116页
        5.3.1 压缩数据的存储形式第112-114页
        5.3.2 启发式的区级数据压缩策略(HDCE)第114-116页
    5.4 压缩数据的查询第116-123页
        5.4.1 处理过滤属性第118-120页
        5.4.2 处理选择属性和连接属性第120-123页
    5.5 实验评估第123-125页
        5.5.1 压缩数据的存储性能评估第123-125页
        5.5.2 压缩数据的查询性能评估第125页
    5.6 本章小结第125-126页
第6章 总结与展望第126-129页
    6.1 本文研究工作总结第126-127页
    6.2 未来工作展望第127-129页
参考文献第129-138页
附录第138-149页
致谢第149-151页
读博期间发表和录用的论文第151页

论文共151页,点击 下载论文
上一篇:禾谷镰刀菌(Fusarium asiaticum)蓝光受体基因Fawc1和Favvd的功能分析
下一篇:基于植被格局分形特征的流域水土流失响应及其应用研究