摘要 | 第10-12页 |
ABSTRACT | 第12-13页 |
第一章 绪论 | 第16-36页 |
1.1 课题背景 | 第16-23页 |
1.1.1 大数据时代对存储层次提出了新需求 | 第16-18页 |
1.1.2 新型非易失内存技术简介 | 第18-21页 |
1.1.3 对非易失存储研究的重要意义 | 第21-23页 |
1.2 相关研究现状及进展 | 第23-30页 |
1.2.1 非易失主存系统 | 第23-25页 |
1.2.2 片上非易失存储技术 | 第25-28页 |
1.2.3 GPGPU寄存器文件优化技术 | 第28-30页 |
1.3 研究内容及主要贡献 | 第30-34页 |
1.3.1 本文研究内容 | 第30-32页 |
1.3.2 本文主要贡献 | 第32-34页 |
1.4 文章组织结构 | 第34-36页 |
第二章 基于阻变存储器的交叉阵列性能优化设计 | 第36-66页 |
2.1 引言 | 第36-38页 |
2.2 相关背景知识介绍 | 第38-39页 |
2.3 相关工作总结 | 第39-41页 |
2.3.1 非易失主存系统 | 第40页 |
2.3.2 非对称内存架构模型 | 第40-41页 |
2.4 交叉阵列访问延迟不对称 | 第41-46页 |
2.4.1 阻变存储器阵列的组织方式 | 第41-42页 |
2.4.2 交叉阵列中的读写机制 | 第42-43页 |
2.4.3 可变的RESET操作延迟 | 第43-46页 |
2.5 非对称交叉阵列设计 | 第46-55页 |
2.5.1 划分交叉阵列为多个区域 | 第46-47页 |
2.5.2 交叉阵列内访问的热点现象 | 第47-49页 |
2.5.3 创建间接区域 | 第49-51页 |
2.5.4 区域映射与迁移 | 第51-53页 |
2.5.5 损耗均衡的问题 | 第53-55页 |
2.6 实验评测及结果分析 | 第55-64页 |
2.6.1 模拟实验环境配置 | 第56-57页 |
2.6.2 测试程序集配置 | 第57-58页 |
2.6.3 程序运行结果分析 | 第58-64页 |
2.7 本章小结 | 第64-66页 |
第三章 基于STT-RAM的GPGPU寄存器文件能耗优化设计 | 第66-84页 |
3.1 引言 | 第66-68页 |
3.2 相关背景知识介绍 | 第68-70页 |
3.2.1 GPGPU体系架构和寄存器文件 | 第68页 |
3.2.2 STT-RAM非易失内存技术 | 第68-70页 |
3.3 高能效寄存器文件设计 | 第70-76页 |
3.3.1 寄存器文件配置 | 第70页 |
3.3.2 值相似感知的压缩算法 | 第70-72页 |
3.3.3 细粒度写电路设计 | 第72-74页 |
3.3.4 集中式写缓冲管理 | 第74-75页 |
3.3.5 放松STT-RAM保持数据时间 | 第75-76页 |
3.4 实验评测及结果分析 | 第76-82页 |
3.4.1 模拟实验配置 | 第76-78页 |
3.4.2 性能结果分析 | 第78页 |
3.4.3 能量结果分析 | 第78-79页 |
3.4.4 各部分能量消耗结果分析 | 第79-80页 |
3.4.5 集中式写缓冲评估 | 第80-81页 |
3.4.6 基准测试程序压缩率分析 | 第81-82页 |
3.4.7 硬件面积开销分析 | 第82页 |
3.5 本章小结 | 第82-84页 |
第四章 基于STT-RAM的GPGPU寄存器文件可靠性优化设计 | 第84-104页 |
4.1 引言 | 第84-87页 |
4.2 相关工作总结 | 第87-88页 |
4.2.1 基于STT-RAM的寄存器文件设计 | 第87页 |
4.2.2 STT-RAM读干扰问题 | 第87-88页 |
4.3 相关背景知识介绍 | 第88-90页 |
4.3.1 GPGPU体系架构和寄存器文件 | 第88页 |
4.3.2 STT-RAM非易失存储技术 | 第88-90页 |
4.4 STT-RAM读干扰问题 | 第90-92页 |
4.4.1 STT-RAM的读干扰问题 | 第90-91页 |
4.4.2 读干扰造成的可靠性问题 | 第91-92页 |
4.5 Red-Shield设计 | 第92-98页 |
4.5.1 有效避免死写的恢复操作 | 第93-95页 |
4.5.2 读缓存设计 | 第95-96页 |
4.5.3 自适应恢复策略设计 | 第96-98页 |
4.6 实验评测及结果分析 | 第98-103页 |
4.6.1 实验测试环境配置 | 第98-99页 |
4.6.2 性能和能量分析 | 第99-102页 |
4.6.3 软硬件开销分析 | 第102-103页 |
4.7 本章小结 | 第103-104页 |
第五章 基于赛道存储器的GPGPU寄存器文件优化设计 | 第104-120页 |
5.1 引言 | 第104-105页 |
5.2 相关背景知识介绍 | 第105-107页 |
5.2.1 采用的GPGPU体系架构模型 | 第105页 |
5.2.2 赛道存储介质 | 第105-107页 |
5.3 相关工作总结 | 第107-108页 |
5.4 整体设计 | 第108-112页 |
5.4.1 基于赛道存储器的寄存器文件配置 | 第108页 |
5.4.2 SIMT架构的值相似特性 | 第108-110页 |
5.4.3 轻量级压缩算法框架 | 第110-112页 |
5.5 实验评测及结果分析 | 第112-118页 |
5.5.1 实验结果分析比较 | 第115-117页 |
5.5.2 硬件开销分析 | 第117-118页 |
5.6 本章小结 | 第118-120页 |
第六章 结论与展望 | 第120-124页 |
6.1 工作总结 | 第120-121页 |
6.2 未来研究工作展望 | 第121-124页 |
致谢 | 第124-128页 |
参考文献 | 第128-142页 |
作者在学期间取得的学术成果 | 第142-144页 |
作者在学期间参与的科研项目 | 第144页 |