首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--编译程序、解释程序论文

OpenACC 2.0性能可移植性分析

摘要第3-4页
ABSTRACT第4页
List of Abbreviations第12-14页
第一章 Introduction第14-22页
    1.1 High Performance Computing (HPC)第14页
    1.2 Problem de?nition第14-16页
        1.2.1 Portability第14-15页
        1.2.2 Productivity第15页
        1.2.3 Performance第15-16页
    1.3 Objectives第16-17页
    1.4 Summary of contributions第17页
    1.5 Related works第17-22页
        1.5.1 The investigated work on GPU第18-19页
        1.5.2 The investigated work on MIC and a Hybrid system第19-22页
第二章 Programming in Heterogeneous System第22-34页
    2.1 The Architectures for Heterogeneous System第22-25页
        2.1.1 Graphics Processing Units (GPUs)第23-24页
        2.1.2 Intel Many Integrated Core (MIC)第24-25页
    2.2 Programming languages and frameworks第25-34页
        2.2.1 Parallel Thread Execution (PTX)第25-26页
        2.2.2 Open ACC第26-27页
        2.2.3 What is HMPP Codelet and how to get HMPP codelet, PTX,and MIC machine code files第27-28页
        2.2.4 Comparison of Open ACC and low-level programming model第28-30页
        2.2.5 Open ACC 2.0第30-34页
第三章 Methodologies and Tuning techniques第34-42页
    3.1 Open CL optimization第34-35页
    3.2 Open ACC optimizations第35-42页
        3.2.1 Independent optimization第35-36页
        3.2.2 Directive organize optimization第36页
        3.2.3 ILP optimization第36-37页
        3.2.4 Grid Thread Mapping optimization第37-40页
        3.2.5 Compiler ?ags第40页
        3.2.6 Tiling optimization第40-42页
第四章 Experimental setup第42-50页
    4.1 Testbed machine第42页
        4.1.1 π Supercomputer第42页
    4.2 Banchmarks第42-48页
        4.2.1 Rodinia benchmark suite and selected benchmarks第43-47页
        4.2.2 Hydro Benchmark第47页
        4.2.3 EPCC Benchmark第47-48页
    4.3 Pro?ling tools第48-50页
第五章 Results and Discussion第50-80页
    5.1 Discussion of each optimizations第50-61页
        5.1.1 Directive organize optimization and Simple restructuring第50-51页
        5.1.2 Independent optimization第51-52页
        5.1.3 ILP optimizations第52-53页
        5.1.4 Grid thread mapping optimization第53-57页
        5.1.5 Tiling optimization第57-60页
        5.1.6 Compiler ?ags第60-61页
    5.2 Analyze each applications第61-80页
        5.2.1 Breadth First Search (BFS)第62-65页
        5.2.2 Gaussian Elimination (GE)第65-70页
        5.2.3 Back Propagation (BP)第70-72页
        5.2.4 LU Decomposition (LUD)第72-74页
        5.2.5 Hydro Benchmark第74-80页
第六章 Conclusion第80-82页
第七章 Future Work第82-84页
参考文献第84-88页
Publication第88-90页

论文共90页,点击 下载论文
上一篇:基于相似性网络融合的目标分类研究
下一篇:基于Kinect图像的驾驶员脸部跟踪