| 摘要 | 第1-17页 |
| ABSTRACT | 第17-19页 |
| 第一章绪论 | 第19-37页 |
| ·研究背景 | 第19-22页 |
| ·VLSI 技术的发展对处理器体系结构的影响 | 第19-20页 |
| ·应用对体系结构提出新的要求 | 第20-21页 |
| ·高性能体系结构面临新的挑战 | 第21-22页 |
| ·传统的高性能微处理器 | 第22-25页 |
| ·专用处理器 | 第23页 |
| ·通用微处理器 | 第23-24页 |
| ·DSP 与可编程的媒体处理器 | 第24-25页 |
| ·新型流体系结构的研究现状 | 第25-33页 |
| ·基于片上存储的VIRAM 体系结构 | 第25-26页 |
| ·片内多处理机体系结构的代表:RAW 和TRIPS | 第26-27页 |
| ·Imagine 和Merrimac 流体系结构 | 第27-28页 |
| ·CELL 处理器 | 第28-29页 |
| ·流计算模型Score | 第29-30页 |
| ·新型流体系结构小结 | 第30-33页 |
| ·论文工作 | 第33-36页 |
| ·论文结构 | 第36-37页 |
| 第二章流体系结构模型 | 第37-59页 |
| ·流处理思想 | 第37-38页 |
| ·硬件结构模型 | 第38-44页 |
| ·解耦合计算和访存 | 第39-40页 |
| ·多级存储层次 | 第40-44页 |
| ·流程序设计模型及程序语言 | 第44-51页 |
| ·流级程序 | 第45-46页 |
| ·核心级程序 | 第46-48页 |
| ·流程序设计框架及实例 | 第48-51页 |
| ·面向流体系结构的编译 | 第51-54页 |
| ·层次化的流编译器结构 | 第51-52页 |
| ·流级编译 | 第52-54页 |
| ·核心级编译 | 第54页 |
| ·流处理实例及与向量的比较 | 第54-57页 |
| ·小结 | 第57-59页 |
| 第三章MASA-I流处理器设计 | 第59-118页 |
| ·设计方法 | 第59-63页 |
| ·FPGA 设计流程 | 第60-61页 |
| ·EP25180 器件特性分析 | 第61-63页 |
| ·MASA-I 微体系结构 | 第63-67页 |
| ·MASA-I 系统框架 | 第63-65页 |
| ·三级存储带宽层次 | 第65-66页 |
| ·三类并行模式 | 第66-67页 |
| ·MASA-I 的指令集体系结构 | 第67-73页 |
| ·数据类型 | 第68页 |
| ·MASA-I 流级指令集 | 第68-69页 |
| ·MASA-I 核心级指令集 | 第69-73页 |
| ·MASA-I 的流水线体系结构 | 第73-78页 |
| ·指令执行流水线的组织结构 | 第74-75页 |
| ·流数据访问流水线的组织结构 | 第75页 |
| ·流水线的数据通路及其相关处理 | 第75-77页 |
| ·流水线时序 | 第77-78页 |
| ·流控制器 | 第78-81页 |
| ·记分牌 | 第79-80页 |
| ·流指令发射单元 | 第80-81页 |
| ·存储系统 | 第81-85页 |
| ·地址生成器 | 第82-85页 |
| ·运算簇模块的设计 | 第85-93页 |
| ·运算簇中的寄存器文件和互连开关 | 第85-87页 |
| ·ALU 模块 | 第87-89页 |
| ·MUL 模块 | 第89-91页 |
| ·非运算功能单元:SP、COM | 第91-93页 |
| ·微控制器模块的设计 | 第93-96页 |
| ·微指令存储器 | 第94-95页 |
| ·微控制寄存器文件和微控制器条件寄存器文件 | 第95-96页 |
| ·流缓冲控制接口 | 第96页 |
| ·片上流寄存器文件的设计 | 第96-100页 |
| ·MASA-I 特殊执行机制的设计 | 第100-112页 |
| ·MASA-I 条件流的执行机制 | 第101-106页 |
| ·MASA-I 软件流水的执行机制 | 第106-108页 |
| ·MASA-I 流寄存器文件的仲裁调度 | 第108-112页 |
| ·MASA-I 系统的综合与布局布线 | 第112-117页 |
| ·综合 | 第114页 |
| ·系统布局布线 | 第114-115页 |
| ·关键路径分析和讨论 | 第115-116页 |
| ·MASA-I SOPC 系统开发板 | 第116-117页 |
| ·小结 | 第117-118页 |
| 第四章流体系结构的多维可扩展性研究 | 第118-149页 |
| ·流体系结构的扩展性问题 | 第118-120页 |
| ·MASA 流体系结构的二维可扩展性 | 第120-128页 |
| ·簇内扩展 | 第120-125页 |
| ·簇间扩展 | 第125-128页 |
| ·多核扩展 | 第128-147页 |
| ·多核扩展的动机及其思想 | 第128-132页 |
| ·面向多核扩展的流处理并行执行模式 | 第132-134页 |
| ·基于多核可扩展结构的MASA-II 流处理器设计 | 第134-146页 |
| ·评估分析 | 第146-147页 |
| ·小结 | 第147-149页 |
| 第五章基于准动态调度的多核协同机制 | 第149-193页 |
| ·准动态调度的概念 | 第149-151页 |
| ·流处理核间的协同运行 | 第151-157页 |
| ·多核上的任务划分 | 第151-152页 |
| ·同构核协同框架 | 第152-155页 |
| ·多核通讯机制 | 第155-157页 |
| ·异构核间的协同运行 | 第157-166页 |
| ·异构核间协同框架 | 第157-159页 |
| ·分离片外存储空间的异构核协同 | 第159-163页 |
| ·共享片外存储空间的异构核协同 | 第163-166页 |
| ·多核协同机制的组成和实现 | 第166-192页 |
| ·面向多核的流程序设计 | 第166-170页 |
| ·多核流程序的静态编译 | 第170-179页 |
| ·硬件动态调度模块:流控制器 | 第179-183页 |
| ·软硬件结合点:流处理器接口 | 第183-185页 |
| ·软件运行时调度模块:协处理中间件 | 第185-192页 |
| ·小结 | 第192-193页 |
| 第六章流式二维拉格朗日和欧拉结合法 | 第193-208页 |
| ·Ygx2 概述及映射意义 | 第193-194页 |
| ·Ygx2 在MASA 上的映射 | 第194-199页 |
| ·数据流图 | 第194-195页 |
| ·主要计算模式及流式实现 | 第195-199页 |
| ·程序优化 | 第199-201页 |
| ·实验结果分析与性能评测 | 第201-204页 |
| ·核心程序结果分析及优化 | 第201-203页 |
| ·应用总体性能分析和比较 | 第203-204页 |
| ·讨论 | 第204-207页 |
| ·分块与流寄存器文件大小对性能影响 | 第204-205页 |
| ·科学计算的新特征及未来的改进 | 第205-207页 |
| ·小结 | 第207-208页 |
| 第七章MASA流体系结构性能评测 | 第208-227页 |
| ·应用开发环境 | 第208-211页 |
| ·应用开发环境的组成 | 第208-209页 |
| ·时钟精确的C++模拟器MSIM | 第209-211页 |
| ·MASA 流体系结构性能评测 | 第211-226页 |
| ·流处理核性能评测 | 第211-216页 |
| ·流处理器系统级性能评测 | 第216-219页 |
| ·多维扩展对应用的影响 | 第219-226页 |
| ·小结 | 第226-227页 |
| 第八章结束语 | 第227-231页 |
| ·本文的主要工作与创新 | 第227-229页 |
| ·未来的研究方向 | 第229-231页 |
| 致谢 | 第231-233页 |
| 参考文献 | 第233-240页 |
| 作者在学期间取得的学术成果 | 第240-242页 |
| 附录A MASA核心指令的域及子域划分 | 第242-246页 |
| 附录B 条件流指令功能的伪代码描述 | 第246-247页 |