摘要 | 第1-13页 |
ABSTRACT | 第13-15页 |
第一章 绪论 | 第15-32页 |
·微处理器技术的发展及面临的挑战 | 第15-17页 |
·数据并行处理器(DPP):微处理器的高效能之路 | 第17-18页 |
·DPP中指令流出的协同性问题 | 第18-20页 |
·DPP中指令流出协同性的相关研究 | 第20-27页 |
·指令流出方式的高效融合研究 | 第20-23页 |
·串行处理瓶颈的克服 | 第23-24页 |
·分支问题的相关研究 | 第24-26页 |
·同时多宽度SIMD支持 | 第26-27页 |
·本文主要创新工作 | 第27-30页 |
·论文结构 | 第30-32页 |
第二章 DPP中指令流出技术的高效融合及瓶颈分析 | 第32-53页 |
·引言 | 第32-34页 |
·指令流出技术融合的现状 | 第32-34页 |
·指令流出技术高效融合的挑战 | 第34页 |
·DPP的融合性能模型 | 第34-39页 |
·片上多核领域的Amdahl定律 | 第34-35页 |
·Amdahl定律在DPP上的扩展 | 第35-39页 |
·DPP的融合性能模型分析 | 第39-46页 |
·应用相关参数提取 | 第39-40页 |
·无需通信类kernel的融合性能分析 | 第40-43页 |
·需要通信类kernel的融合性能分析 | 第43-45页 |
·融合性能分析小结 | 第45-46页 |
·DPP的融合功耗开销模型 | 第46-48页 |
·关注功耗的性能分析 | 第48-51页 |
·本章小结 | 第51-53页 |
第三章 双核化框架:DPP中高效的串行处理加速技术 | 第53-76页 |
·引言 | 第53-55页 |
·串、并行处理间并行性的高效挖掘技术:kernel级软件流水 | 第55-58页 |
·顺序连接的串、并行kernel结构 | 第55-56页 |
·kernel级软件流水技术 | 第56-58页 |
·双核化框架结构 | 第58-64页 |
·来自应用的启示 | 第58-60页 |
·双核化框架的微体系结构 | 第60-62页 |
·单、双核动态转化的执行方式 | 第62-63页 |
·例外处理 | 第63-64页 |
·统一分支与快速数据共享技术 | 第64-66页 |
·应用分析 | 第64-65页 |
·微体系结构描述 | 第65-66页 |
·双核化框架的扩展结构 | 第66页 |
·性能评估 | 第66-74页 |
·实验设置 | 第66-68页 |
·控制运算解耦分析 | 第68-70页 |
·性能及标量单元利用率分析 | 第70-72页 |
·SIMD宽度对性能的影响 | 第72-73页 |
·交互密集型应用的加速分析 | 第73页 |
·硬件开销 | 第73-74页 |
·相关工作 | 第74-75页 |
·本章小结 | 第75-76页 |
第四章 指令混洗技术:DPP中连接SIMD与MIMD结构的桥梁 | 第76-89页 |
·引言 | 第76-77页 |
·研究动机 | 第77-80页 |
·指令混洗微体系结构 | 第80-85页 |
·硬件组成部件 | 第80-84页 |
·指令集体系结构 | 第84-85页 |
·硬件开销 | 第85页 |
·实验方法 | 第85-86页 |
·性能评估 | 第86-88页 |
·总体性能提升 | 第86-87页 |
·指令buffer数目效应 | 第87-88页 |
·本章小结 | 第88-89页 |
第五章 多SIMD多数据流(MSMD):DPP中动态与静态分组的并行执行技术 | 第89-111页 |
·引言 | 第89-91页 |
·MSMD机制概述 | 第91-94页 |
·MSMD微体系结构 | 第94-98页 |
·MSMD硬件结构 | 第94-96页 |
·指令集体系结构 | 第96-97页 |
·硬件开销 | 第97-98页 |
·指令buffer调度策略 | 第98-102页 |
·贪心调度策略 | 第98-99页 |
·EBLA调度策略 | 第99-102页 |
·EBLA调度算法的执行时支持 | 第102页 |
·实验方法 | 第102-105页 |
·性能评估 | 第105-109页 |
·总体性能提升 | 第105-107页 |
·指令buffer数目对性能的影响 | 第107-108页 |
·SIMD宽度的影响 | 第108-109页 |
·相关工作 | 第109-110页 |
·本章小结 | 第110-111页 |
第六章 融合双核化框架及多SIMD多数据流的协同指令流出技术 | 第111-125页 |
·引言 | 第111-113页 |
·协同指令流出技术 | 第113-118页 |
·协同指令流出机制概述 | 第113-114页 |
·协同指令流出机制硬件支撑 | 第114-116页 |
·协同指令流出执行方式 | 第116-118页 |
·评估验证平台概述:FT-QMBase高性能DPP | 第118-121页 |
·协同指令流出技术的验证与评估 | 第121-124页 |
·面积开销评估 | 第121-122页 |
·性能提升评估 | 第122-124页 |
·本章小结 | 第124-125页 |
第七章 结论与展望 | 第125-129页 |
·本文主要工作 | 第125-127页 |
·研究展望 | 第127-129页 |
致谢 | 第129-131页 |
参考文献 | 第131-141页 |
作者在学期间取得的学术成果 | 第141-143页 |