首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--编译程序、解释程序论文

面向异构处理器的代价模型及存储优化技术研究

摘要第4-5页
ABSTRACT第5-6页
图目录第10-12页
表目录第12-13页
第一章 绪论第13-23页
    1.1 研究背景第13-15页
        1.1.1 异构处理器的发展第13-14页
        1.1.2 异构处理器在编程上面临的挑战第14-15页
    1.2 课题研究意义第15-16页
    1.3 国内外研究现状第16-19页
        1.3.1 代价模型第16-18页
        1.3.2 存储优化第18-19页
    1.4 论文研究内容第19-20页
    1.5 主要贡献及创新点第20-22页
    1.6 论文结构安排第22-23页
第二章 面向异构结构的并行化编译框架第23-33页
    2.1 异构并行计算架构第23-24页
    2.2 异构并行编程模型第24-27页
        2.2.1 相关研究第24-25页
        2.2.2 OpenACC并行编程模型第25-27页
    2.3 面向OpenACC的自动并行化第27-31页
        2.3.1 Open64简介第28-29页
        2.3.2 并行化编译框架设计第29-31页
    2.4 本章小结第31-33页
第三章 面向异构结构的并行代价模型第33-47页
    3.1 问题提出第33-34页
    3.2 相关研究第34页
    3.3 循环并行性分析第34-35页
    3.4 并行代价模型的构建第35-40页
        3.4.1 循环串行执行时间第36-38页
        3.4.2 循环并行执行时间第38-40页
        3.4.3 并行收益评估第40页
    3.5 基于并行代价模型的并行加速循环识别算法第40-42页
    3.6 面向相邻并行循环的并行区合并与扩展第42-45页
        3.6.1 并行区合并与扩展的提出第42-43页
        3.6.2 并行区合并与扩展算法的实现第43-45页
    3.7 本章小结第45-47页
第四章 面向局部数据存储器的存储优化第47-69页
    4.1 研究背景第47-48页
    4.2 多级自适应的存储优化框架第48-49页
    4.3 数据流分析第49-50页
        4.3.1 基本概念第49页
        4.3.2 研究基础第49-50页
    4.4 数据规模自适应的数组分块第50-56页
        4.4.1 问题提出第50-51页
        4.4.2 相关研究第51页
        4.4.3 数组分块子句的引进第51-53页
        4.4.4 理想数组分块方案求解第53-56页
    4.5 数组访问模式指导的数据分布第56-61页
        4.5.1 问题提出第56页
        4.5.2 相关研究第56-57页
        4.5.3 数据分布子句的引进第57-58页
        4.5.4 数据分布子句的自动生成第58-61页
    4.6 主从协作的数组转置第61-64页
        4.6.1 问题提出第61页
        4.6.2 数组转置子句的引进第61-63页
        4.6.3 数组转置子句的自动生成第63-64页
    4.7 多点融合的标量聚集第64-65页
        4.7.1 问题提出第64页
        4.7.2 数据打包子句的引进第64-65页
        4.7.3 数据打包子句的自动生成第65页
    4.8 简约的外围数据传输第65-67页
        4.8.1 问题提出第65页
        4.8.2 加速数据区编译指示的引进第65-66页
        4.8.3 加速数据区编译指示的自动生成第66-67页
    4.9 本章小结第67-69页
第五章 测试与实验分析第69-81页
    5.1 测试环境准备第69页
        5.1.1 硬件环境第69页
        5.1.2 软件环境第69页
    5.2 测试及分析第69-80页
        5.2.1 并行代价模型测试第69-72页
        5.2.2 局部存储优化技术测试第72-79页
        5.2.3 联合测试第79-80页
    5.3 本章小结第80-81页
第六章 结论第81-83页
致谢第83-85页
参考文献第85-91页
作者简历 攻读硕士学位期间完成的主要工作第91页

论文共91页,点击 下载论文
上一篇:商业银行流动性风险管理系统的设计与实现
下一篇:模式可配置的NAND flash纠错系统设计与实现