首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

影响CUDA程序功耗的主要因素研究

西北师范大学研究生学位论文作者信息第5-9页
摘要第9-10页
Abstract第10页
1 绪论第11-16页
    1.1 研究背景、目的及意义第11-12页
    1.2 本课题研究现状第12-14页
    1.3 本文的主要工作第14页
    1.4 本文的组织结构第14-16页
2 CUDA基础知识介绍第16-31页
    2.1 CUDA的编程模型介绍第16-19页
        2.1.1 核函数的定义与调用第17-18页
        2.1.2 线程组织层次第18-19页
    2.2 CUDA的软件体系第19-24页
        2.2.1 CUDA C语言的扩展第20-21页
        2.2.2 CUDA应用程序的编译流程第21-23页
        2.2.3 CUDA驱动程序和运行时的接口第23页
        2.2.4 CUDA函数库第23-24页
    2.3 CUDA Profiler第24-25页
    2.4 CUDA的存储器模型第25-30页
        2.4.1 全局存储器第26-27页
        2.4.2 寄存器第27页
        2.4.3 共享存储器第27-28页
        2.4.4 局部存储器第28-29页
        2.4.5 纹理存储器第29页
        2.4.6 常数存储器第29-30页
    2.5 本章小结第30-31页
3 功耗的主要影响因素第31-39页
    3.1 程序功耗来源第31-32页
        3.1.1 功耗与能耗第31-32页
        3.1.2 功耗来源分析第32页
    3.2 影响因素分析第32-34页
    3.3 功耗评估平台第34-37页
        3.3.1 GPGPU-Sim性能模拟器第34-35页
        3.3.2 GPUWattch功耗模拟器第35-37页
        3.3.3 模拟器的精确性第37页
    3.4 本章小结第37-39页
4 实验方案和平台第39-49页
    4.1 测试程序第39页
    4.2 线程组织结构方案设计第39-40页
    4.3 变量存储位置方案设计第40-44页
        4.3.1 变量处于共享存储器第40-41页
        4.3.2 变量处于全局存储器第41-42页
        4.3.3 普通矩阵乘法第42-43页
        4.3.4 使用共享存储器的矩阵乘法第43-44页
    4.4 实验验证环境第44-48页
        4.4.1 模拟软件的配置第44-46页
        4.4.2 输出文件说明第46-48页
        4.4.3 实验平台配置第48页
    4.5 本章小结第48-49页
5 实验结果分析第49-54页
    5.1 线程块数与功耗的关系第49-50页
    5.2 线程组织结构与功耗的关系第50-51页
    5.3 变量存储位置与功耗的关系第51-52页
    5.4 数据规模与功耗的关系第52页
    5.5 本章小结第52-54页
6 总结与展望第54-55页
    6.1 工作总结第54页
    6.2 研究展望第54-55页
参考文献第55-59页
攻读硕士学位期间发表的论文第59-60页
致谢第60页

论文共60页,点击 下载论文
上一篇:Web Service技术及其在贵州省税源专业化系统中的应用研究
下一篇:物联网环境下的一种跨域信任评价