首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

异构并行系统统一编程环境关键技术研究

摘要第10-13页
ABSTRACT第13-15页
第一章 绪论第16-34页
    1.1 课题背景第16-20页
        1.1.1 编程方法的统一 -Open CL第17-18页
        1.1.2 应对可重构系统的挑战 -BORPH第18-20页
    1.2 研究现状第20-29页
        1.2.1 加速器型异构并行系统第20-25页
        1.2.2 片上异构并行系统第25-27页
        1.2.3 多FPGA系统第27-29页
    1.3 本文主要内容及创新点第29-32页
    1.4 论文结构第32-34页
第二章 多设备的虚拟化单一视图第34-56页
    2.1 VHCD运行时总体设计第35-36页
    2.2 VHCD运行时的实现第36-46页
        2.2.1 离线负载评估和分配第37-39页
        2.2.2 定义Buffer访问模式第39页
        2.2.3 多设备间负载分布第39-41页
        2.2.4 执行分布式Kernel第41-42页
        2.2.5 软件管理虚拟分布式Cache第42-44页
        2.2.6 全过程总述第44-46页
    2.3 性能评估第46-52页
        2.3.1 测试结果第48-51页
        2.3.2 性能可移植性第51-52页
    2.4 相关工作第52-53页
    2.5 小结第53-56页
第三章 自动化细粒度分布式共享存储管理第56-74页
    3.1 DSOM设计动机第56-58页
    3.2 DSOM的设计与实现第58-67页
        3.2.1 DSOM总体简介第58-59页
        3.2.2 Buffer管理器第59-61页
        3.2.3 访问范围生成器第61-67页
    3.3 性能评估第67-71页
        3.3.1 适用性第67页
        3.3.2 性能评估第67-71页
        3.3.3 NVIDIA运行时的共享Buffer管理评估第71页
    3.4 相关工作第71-72页
    3.5 小结第72-74页
第四章 面向CPU的性能自动优化第74-90页
    4.1 面向GPU优化Open CL程序的特征第74-75页
    4.2 NOCL总体设计第75-76页
    4.3 激进Work-item串行化第76-81页
        4.3.1 数组访问分析第76-77页
        4.3.2 Local数组消除第77-79页
        4.3.3 依赖性测试第79-81页
    4.4 性能优化第81-83页
        4.4.1 自动向量化第81-82页
        4.4.2 Cache管理第82-83页
    4.5 性能评估第83-86页
    4.6 相关工作第86-87页
        4.6.1 Open CL运行时实现第86页
        4.6.2 自动性能调优第86-87页
        4.6.3 数组访问分析第87页
    4.7 小结第87-90页
第五章 可重构计算机的高效率软硬件通信第90-104页
    5.1 BORPH-N总体设计第91-93页
        5.1.1 系统层次结构第91-92页
        5.1.2 基于共享存储的进程间通信第92-93页
    5.2 基本实现第93-94页
        5.2.1 片上体系结构第93-94页
        5.2.2 软件第94页
    5.3 基于独立执行的性能优化第94-98页
        5.3.1 独立虚拟存储访问第96-97页
        5.3.2 定制同步存储单元第97-98页
    5.4 性能评测第98-102页
        5.4.1 基本实现的远程系统服务调用第99页
        5.4.2 高性能信号量操作第99-100页
        5.4.3 虚拟存储访问第100-101页
        5.4.4 性能分析第101-102页
    5.5 相关研究第102-103页
    5.6 小结第103-104页
第六章 结论与展望第104-108页
    6.1 工作总结第104-106页
    6.2 未来的研究方向第106-108页
致谢第108-110页
参考文献第110-120页
作者在学期间取得的学术成果第120-121页

论文共121页,点击 下载论文
上一篇:中国高技术产业创新效率动态演化的实证研究
下一篇:变分法在数学物理问题中的应用