首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

以数据为中心的多核处理器软硬件协同优化关键技术研究

摘要第3-5页
Abstract第5-6页
第1章 引言第11-20页
    1.1 研究背景与意义第11-16页
        1.1.1 低功耗高效能的片上多核处理器研究第11-13页
        1.1.2 “以数据为中心”的系统设计第13-16页
    1.2 研究内容和主要贡献第16-18页
        1.2.1 研究内容第16-17页
        1.2.2 主要贡献第17-18页
    1.3 论文组织结构第18-20页
第2章 相关工作第20-26页
    2.1 定制化的系统结构设计与优化第20-21页
    2.2 硬件支持的消息传递第21-22页
    2.3 计算趋近数据的设计第22-24页
    2.4 推测多线程在CMP上的实现和线程调度优化第24-26页
第3章 针对Stencil计算的软硬件协同优化第26-48页
    3.1 问题描述第26-29页
    3.2 软硬件协同优化平台第29-31页
    3.3 针对Stencil计算的软硬件协同优化过程和实现第31-40页
        3.3.1 定制化的浮点SIMD指令第31-33页
        3.3.2 软件优化第33-37页
        3.3.3 内存带宽优化第37-38页
        3.3.4 DMA结合片上存储优化第38-40页
    3.4 性能与功耗评估第40-46页
        3.4.1 仿真环境和测试用例第40页
        3.4.2 各个优化策略的性能、功耗和面积比较第40-43页
        3.4.3 芯片面积和能效性分析第43-45页
        3.4.4 与x86及其他平台的比较第45-46页
    3.5 本章小结第46-48页
第4章 硬件支持的片上消息传递机制第48-71页
    4.1 问题描述第48-51页
    4.2 片上消息传递机制硬件设计与实现第51-59页
        4.2.1 集成硬件消息引擎的CMP结构第51-52页
        4.2.2 消息引擎的结构设计第52-53页
        4.2.3 消息的类型划分与消息包格式第53-56页
        4.2.4 消息引擎的实现第56-59页
    4.3 片上消息传递机制性能优化第59-63页
        4.3.1 不同大小消息传输过程第59-61页
        4.3.2 聚合通信的优化第61-63页
    4.4 片上消息传递机制仿真与评估第63-69页
        4.4.1 仿真平台构建第63-64页
        4.4.2 性能评估第64-69页
    4.5 本章小结第69-71页
第5章 “计算趋近数据”的InPlace计算模式第71-104页
    5.1 问题描述第71-74页
    5.2 InPlace计算模型第74-83页
        5.2.1 InPlace计算模型描述第74-77页
        5.2.2 片上不规则数据访问性能模型第77-80页
        5.2.3 InPlace计算模式适用性第80-83页
    5.3 InPlace模式具体设计与优化第83-89页
        5.3.1 支持InPlace模式的CMP结构和硬件支持的消息编程接口第83-85页
        5.3.2 负载均衡第85-87页
        5.3.3 片上Scratchpad存储片的分布第87-89页
    5.4 实验评估第89-103页
        5.4.1 实验方法第89-90页
        5.4.2 性能评估第90-101页
        5.4.3 讨论第101-103页
    5.5 本章小结第103-104页
第6章 “以数据为中心”的推测多线程调度第104-128页
    6.1 问题描述第104-106页
    6.2 推测多线程介绍和性能分析模型第106-109页
        6.2.1 推测多线程机制介绍第106-108页
        6.2.2 推测多线程性能分析模型第108-109页
    6.3 兼容设计的TLS软硬件执行机制第109-116页
        6.3.1 TLS硬件扩展第110-113页
        6.3.2 推测多线程软件生成框架第113-115页
        6.3.3 TLS模式和非TLS模式切换第115页
        6.3.4 对TLS机制的能效优化第115-116页
    6.4 “以数据为中心”的推测多线程调度第116-121页
        6.4.1 TLS在大规模CMP上的数据访问瓶颈第116-118页
        6.4.2 “以数据为中心”的推测多线程调度策略第118页
        6.4.3 用于推测多线程执行的核数目第118-119页
        6.4.4 推测多线程调度策略第119-121页
    6.5 实验和评估第121-126页
        6.5.1 TLS支持的CMP平台构建第121-123页
        6.5.2 扩展SESC对推测多线程机制支持第123-124页
        6.5.3 测试程序第124页
        6.5.4 实验评估第124-126页
    6.6 本章小结第126-128页
第7章 全文工作总结和未来工作第128-131页
    7.1 全文工作总结第128-129页
    7.2 未来工作第129-131页
参考文献第131-141页
致谢第141-142页
个人简历、在学期间发表的学术论文与研究成果第142-144页

论文共144页,点击 下载论文
上一篇:重夸克偶素的电磁产生过程及其在热介质中的离解
下一篇:CMIP5地球系统模式对全球海气CO2通量的模拟评估