首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--各种电子数字计算机论文

GPU上并行数据操作技术优化

摘要第3-5页
ABSTRACT第5-6页
第一章 绪论第10-14页
    1.1 研究背景第10-12页
    1.2 国内外研究现状第12-13页
    1.3 本文的组织第13-14页
第二章 CUDA 简介第14-30页
    2.1 GPU 介绍第14-15页
    2.2 CUDA 执行模型第15-17页
    2.3 CUDA 中的基本概念第17-19页
        2.3.1 核函数(KERNEL 函数)第17-18页
        2.3.2 线程结构第18页
        2.3.3 WARP第18-19页
    2.4 CUDA 执行模型第19页
    2.5 CUDA 软件体系第19-23页
        2.5.1 CUDA C 语言第20-21页
        2.5.2 NVCC 编译器第21-22页
        2.5.3 运行时API 与驱动API第22-23页
    2.6 CUDA 的存储器模型第23-28页
        2.6.1 寄存器第23-24页
        2.6.2 局部存储器第24页
        2.6.3 共享存储器第24页
        2.6.4 全局存储器第24页
        2.6.5 常数内存(CONSTANT MEMORY)和纹理内存(TEXTURE MEMORY)第24-25页
        2.6.6 共享存储器访问冲突第25-28页
    2.7 CUDA 通信机制第28-30页
        2.7.1 __SYNCTHREADS()第28页
        2.7.2 MEMORY FENCE 函数第28页
        2.7.3 核函数间通信第28页
        2.7.4 原子操作第28-30页
第三章 数据库连接(JOIN)操作简介第30-42页
    3.1 JOIN 语义第30-31页
    3.2 连接操作的串行实现第31-34页
        3.2.1 嵌套循环连接(NESTED-LOOP JOIN)第31-32页
        3.2.2 排序-合并连接(SORT-MERGE JOIN)第32-33页
        3.2.3 哈希连接(HASH JOIN)第33-34页
    3.3 连接操作的并行实现第34-37页
        3.3.1 并行嵌套循环连接算法第34页
        3.3.2 并行的排序归并连接算法第34-36页
        3.3.3 并行的哈希连接算法第36-37页
    3.4 多维数据分布方法CMD 以及基于CMD 的连接算法第37-42页
        3.4.1 多维数据分布方法CMD第37-39页
        3.4.2 基于CMD 算法的连接算法第39-42页
第四章 并行连接算法在GPU 平台上的实现和优化第42-56页
    4.1 GPU 架构同多处理机的类比第42-43页
    4.2 GPU 平台上的数据操作优化第43-47页
        4.2.1 数据分配第43-45页
        4.2.2 线程调度第45-47页
    4.3 并行连接算法在GPU 上的实现第47-51页
        4.3.1 并行排序归并算法第48-49页
        4.3.2 并行哈希算法第49-51页
    4.4 CMD 算法在GPU 上的实现和优化第51-56页
第五章 实现环境第56-58页
    5.1 机器环境第56页
    5.2 实现数据表准备第56-58页
第六章 实验结果及分析第58-63页
第七章 总结与展望第63-64页
参考文献第64-67页
致谢第67-68页
攻读学位期间发表的学术论文第68-70页

论文共70页,点击 下载论文
上一篇:基于Netlogo的股指期货市场交易策略仿真研究
下一篇:对外汉语教材生词表英语译释问题研究