| 摘要 | 第1-13页 |
| ABSTRACT | 第13-15页 |
| 第一章 绪论 | 第15-32页 |
| ·微处理器技术的发展及面临的挑战 | 第15-17页 |
| ·数据并行处理器(DPP):微处理器的高效能之路 | 第17-18页 |
| ·DPP中指令流出的协同性问题 | 第18-20页 |
| ·DPP中指令流出协同性的相关研究 | 第20-27页 |
| ·指令流出方式的高效融合研究 | 第20-23页 |
| ·串行处理瓶颈的克服 | 第23-24页 |
| ·分支问题的相关研究 | 第24-26页 |
| ·同时多宽度SIMD支持 | 第26-27页 |
| ·本文主要创新工作 | 第27-30页 |
| ·论文结构 | 第30-32页 |
| 第二章 DPP中指令流出技术的高效融合及瓶颈分析 | 第32-53页 |
| ·引言 | 第32-34页 |
| ·指令流出技术融合的现状 | 第32-34页 |
| ·指令流出技术高效融合的挑战 | 第34页 |
| ·DPP的融合性能模型 | 第34-39页 |
| ·片上多核领域的Amdahl定律 | 第34-35页 |
| ·Amdahl定律在DPP上的扩展 | 第35-39页 |
| ·DPP的融合性能模型分析 | 第39-46页 |
| ·应用相关参数提取 | 第39-40页 |
| ·无需通信类kernel的融合性能分析 | 第40-43页 |
| ·需要通信类kernel的融合性能分析 | 第43-45页 |
| ·融合性能分析小结 | 第45-46页 |
| ·DPP的融合功耗开销模型 | 第46-48页 |
| ·关注功耗的性能分析 | 第48-51页 |
| ·本章小结 | 第51-53页 |
| 第三章 双核化框架:DPP中高效的串行处理加速技术 | 第53-76页 |
| ·引言 | 第53-55页 |
| ·串、并行处理间并行性的高效挖掘技术:kernel级软件流水 | 第55-58页 |
| ·顺序连接的串、并行kernel结构 | 第55-56页 |
| ·kernel级软件流水技术 | 第56-58页 |
| ·双核化框架结构 | 第58-64页 |
| ·来自应用的启示 | 第58-60页 |
| ·双核化框架的微体系结构 | 第60-62页 |
| ·单、双核动态转化的执行方式 | 第62-63页 |
| ·例外处理 | 第63-64页 |
| ·统一分支与快速数据共享技术 | 第64-66页 |
| ·应用分析 | 第64-65页 |
| ·微体系结构描述 | 第65-66页 |
| ·双核化框架的扩展结构 | 第66页 |
| ·性能评估 | 第66-74页 |
| ·实验设置 | 第66-68页 |
| ·控制运算解耦分析 | 第68-70页 |
| ·性能及标量单元利用率分析 | 第70-72页 |
| ·SIMD宽度对性能的影响 | 第72-73页 |
| ·交互密集型应用的加速分析 | 第73页 |
| ·硬件开销 | 第73-74页 |
| ·相关工作 | 第74-75页 |
| ·本章小结 | 第75-76页 |
| 第四章 指令混洗技术:DPP中连接SIMD与MIMD结构的桥梁 | 第76-89页 |
| ·引言 | 第76-77页 |
| ·研究动机 | 第77-80页 |
| ·指令混洗微体系结构 | 第80-85页 |
| ·硬件组成部件 | 第80-84页 |
| ·指令集体系结构 | 第84-85页 |
| ·硬件开销 | 第85页 |
| ·实验方法 | 第85-86页 |
| ·性能评估 | 第86-88页 |
| ·总体性能提升 | 第86-87页 |
| ·指令buffer数目效应 | 第87-88页 |
| ·本章小结 | 第88-89页 |
| 第五章 多SIMD多数据流(MSMD):DPP中动态与静态分组的并行执行技术 | 第89-111页 |
| ·引言 | 第89-91页 |
| ·MSMD机制概述 | 第91-94页 |
| ·MSMD微体系结构 | 第94-98页 |
| ·MSMD硬件结构 | 第94-96页 |
| ·指令集体系结构 | 第96-97页 |
| ·硬件开销 | 第97-98页 |
| ·指令buffer调度策略 | 第98-102页 |
| ·贪心调度策略 | 第98-99页 |
| ·EBLA调度策略 | 第99-102页 |
| ·EBLA调度算法的执行时支持 | 第102页 |
| ·实验方法 | 第102-105页 |
| ·性能评估 | 第105-109页 |
| ·总体性能提升 | 第105-107页 |
| ·指令buffer数目对性能的影响 | 第107-108页 |
| ·SIMD宽度的影响 | 第108-109页 |
| ·相关工作 | 第109-110页 |
| ·本章小结 | 第110-111页 |
| 第六章 融合双核化框架及多SIMD多数据流的协同指令流出技术 | 第111-125页 |
| ·引言 | 第111-113页 |
| ·协同指令流出技术 | 第113-118页 |
| ·协同指令流出机制概述 | 第113-114页 |
| ·协同指令流出机制硬件支撑 | 第114-116页 |
| ·协同指令流出执行方式 | 第116-118页 |
| ·评估验证平台概述:FT-QMBase高性能DPP | 第118-121页 |
| ·协同指令流出技术的验证与评估 | 第121-124页 |
| ·面积开销评估 | 第121-122页 |
| ·性能提升评估 | 第122-124页 |
| ·本章小结 | 第124-125页 |
| 第七章 结论与展望 | 第125-129页 |
| ·本文主要工作 | 第125-127页 |
| ·研究展望 | 第127-129页 |
| 致谢 | 第129-131页 |
| 参考文献 | 第131-141页 |
| 作者在学期间取得的学术成果 | 第141-143页 |