首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

适用于高性能计算节点的多核系统协同优化设计

致谢第5-6页
摘要第6-8页
Abstract第8-9页
1 绪论第17-33页
    1.1 概述第18-19页
    1.2 发展现状第19-24页
    1.3 研究现状第24-29页
        1.3.1 多核操作系统第24-25页
        1.3.2 片上存储系统第25-28页
        1.3.3 光电互连网络第28-29页
    1.4 本文解决的关键问题第29-30页
    1.5 本文主要内容和工作安排第30-33页
2 多核调度器和接口协议第33-60页
    2.1 系统结构第34-35页
    2.2 接口协议第35-43页
        2.2.1 并行编程模型第35-36页
        2.2.2 应用程序抽象第36-38页
        2.2.3 任务分类第38-40页
        2.2.4 接口函数第40-41页
        2.2.5 协议扩展性第41-43页
    2.3 调度器与执行器第43-46页
    2.4 加速机制第46-48页
    2.5 实验方法第48-50页
    2.6 实验结果第50-58页
        2.6.1 实例分析第50-53页
        2.6.2 系统性能第53-56页
        2.6.3 硬件开销第56-57页
        2.6.4 系统扩展性第57-58页
    2.7 相关工作第58-59页
    2.8 本章小结第59-60页
3 线程感知的自调数据预取引擎第60-95页
    3.1 预取引擎的基本结构第62-66页
    3.2 线程感知的自适应数据预取引擎第66-77页
        3.2.1 预取感知的线程分类自调第66-71页
        3.2.2 减少预取导致的共享缓存无效化第71-74页
        3.2.3 关键线程加速机制第74-76页
        3.2.4 硬件实现第76-77页
    3.3 实验方法第77-81页
    3.4 实验结果第81-91页
        3.4.1 线程分类第81-82页
        3.4.2 减少预取导致的无效化第82页
        3.4.3 攻击预取过滤第82-84页
        3.4.4 关键线程加速第84-85页
        3.4.5 系统性能第85-86页
        3.4.6 能量时延积第86页
        3.4.7 引入HPAC机制对TAP的影响第86-87页
        3.4.8 Cache分区机制的影响第87-88页
        3.4.9 存储带宽第88页
        3.4.10 存储访问请求的分布第88-89页
        3.4.11 敏感度分析第89-90页
        3.4.12 硬件开销第90-91页
    3.5 相关工作第91-93页
    3.6 本章小结第93-95页
4 片上光电互连网络的仿真与设计第95-116页
    4.1 系统仿真概述第96-97页
    4.2 系统实现第97-104页
        4.2.1 模拟器第97-99页
        4.2.2 多线程编程第99-101页
        4.2.3 器件库第101-102页
        4.2.4 功耗计算模型第102-103页
        4.2.5 分簇方法第103页
        4.2.6 仿真规模扩展第103-104页
        4.2.7 仿真流程第104页
    4.3 实验第104-113页
        4.3.1 实验方法第104-107页
        4.3.2 实验结果分析第107-113页
    4.4 相关工作第113-115页
    4.5 本章小结第115-116页
总结与展望第116-118页
参考文献第118-129页
作者攻读博士学位期间发表的论文第129-130页
作者攻读博士学位期间参与的科研工作第130页

论文共130页,点击 下载论文
上一篇:基于视差空间的自主车视觉导航
下一篇:软件无线电中带通滤波器的分析与设计