摘要 | 第3-4页 |
ABSTRACT | 第4页 |
List of Abbreviations | 第12-14页 |
第一章 Introduction | 第14-22页 |
1.1 High Performance Computing (HPC) | 第14页 |
1.2 Problem de?nition | 第14-16页 |
1.2.1 Portability | 第14-15页 |
1.2.2 Productivity | 第15页 |
1.2.3 Performance | 第15-16页 |
1.3 Objectives | 第16-17页 |
1.4 Summary of contributions | 第17页 |
1.5 Related works | 第17-22页 |
1.5.1 The investigated work on GPU | 第18-19页 |
1.5.2 The investigated work on MIC and a Hybrid system | 第19-22页 |
第二章 Programming in Heterogeneous System | 第22-34页 |
2.1 The Architectures for Heterogeneous System | 第22-25页 |
2.1.1 Graphics Processing Units (GPUs) | 第23-24页 |
2.1.2 Intel Many Integrated Core (MIC) | 第24-25页 |
2.2 Programming languages and frameworks | 第25-34页 |
2.2.1 Parallel Thread Execution (PTX) | 第25-26页 |
2.2.2 Open ACC | 第26-27页 |
2.2.3 What is HMPP Codelet and how to get HMPP codelet, PTX,and MIC machine code files | 第27-28页 |
2.2.4 Comparison of Open ACC and low-level programming model | 第28-30页 |
2.2.5 Open ACC 2.0 | 第30-34页 |
第三章 Methodologies and Tuning techniques | 第34-42页 |
3.1 Open CL optimization | 第34-35页 |
3.2 Open ACC optimizations | 第35-42页 |
3.2.1 Independent optimization | 第35-36页 |
3.2.2 Directive organize optimization | 第36页 |
3.2.3 ILP optimization | 第36-37页 |
3.2.4 Grid Thread Mapping optimization | 第37-40页 |
3.2.5 Compiler ?ags | 第40页 |
3.2.6 Tiling optimization | 第40-42页 |
第四章 Experimental setup | 第42-50页 |
4.1 Testbed machine | 第42页 |
4.1.1 π Supercomputer | 第42页 |
4.2 Banchmarks | 第42-48页 |
4.2.1 Rodinia benchmark suite and selected benchmarks | 第43-47页 |
4.2.2 Hydro Benchmark | 第47页 |
4.2.3 EPCC Benchmark | 第47-48页 |
4.3 Pro?ling tools | 第48-50页 |
第五章 Results and Discussion | 第50-80页 |
5.1 Discussion of each optimizations | 第50-61页 |
5.1.1 Directive organize optimization and Simple restructuring | 第50-51页 |
5.1.2 Independent optimization | 第51-52页 |
5.1.3 ILP optimizations | 第52-53页 |
5.1.4 Grid thread mapping optimization | 第53-57页 |
5.1.5 Tiling optimization | 第57-60页 |
5.1.6 Compiler ?ags | 第60-61页 |
5.2 Analyze each applications | 第61-80页 |
5.2.1 Breadth First Search (BFS) | 第62-65页 |
5.2.2 Gaussian Elimination (GE) | 第65-70页 |
5.2.3 Back Propagation (BP) | 第70-72页 |
5.2.4 LU Decomposition (LUD) | 第72-74页 |
5.2.5 Hydro Benchmark | 第74-80页 |
第六章 Conclusion | 第80-82页 |
第七章 Future Work | 第82-84页 |
参考文献 | 第84-88页 |
Publication | 第88-90页 |