图索引 | 第1-9页 |
表索引 | 第9-10页 |
摘要 | 第10-12页 |
ABSTRACT | 第12-15页 |
第一章 绪论 | 第15-30页 |
§1.1 课题研究背景 | 第15-17页 |
·处理器与存储器的性能差异 | 第15-16页 |
·层次存储系统 | 第16-17页 |
·局部性 | 第17页 |
§1.2 课题研究内容 | 第17-21页 |
·课题来源 | 第17页 |
·课题研究重点 | 第17-21页 |
·课题研究难点 | 第21页 |
§1.3 相关研究工作 | 第21-26页 |
·cache局部性优化方面的相关研究工作 | 第21-23页 |
·内存局部性优化方面的相关研究工作 | 第23-25页 |
·伪共享消除方面的相关研究工作 | 第25-26页 |
§1.4 本文的主要工作和创新 | 第26-28页 |
§1.5 基本术语 | 第28-29页 |
§1.6 论文结构 | 第29-30页 |
第二章 基于数据变换技术的cache局部性优化 | 第30-58页 |
§2.1 数据访问轨迹 | 第31-34页 |
§2.2 基于投影分层技术的数据变换框架 | 第34-36页 |
§2.3 优化具有类仿射下标数组的空间局部性 | 第36-51页 |
·空间局部性优化问题求解 | 第36-48页 |
·时间局部性 | 第48页 |
·松耦合嵌套循环 | 第48-49页 |
·多个嵌套循环 | 第49页 |
·无冲突访问判别条件 | 第49-51页 |
·减少数据变换所需的额外存储空间 | 第51页 |
§2.4 优化具有复杂下标数组的空间局部性 | 第51-56页 |
§2.5 与相关工作的比较 | 第56-57页 |
§2.6 本章小结 | 第57-58页 |
第三章 基于循环变换技术的cache局部性优化 | 第58-77页 |
§3.1 优化时间局部性 | 第59-64页 |
·优化单个数组访问的时间局部性 | 第59-62页 |
·优化多个数组访问的时间局部性 | 第62-64页 |
§3.2 优化空间局部性 | 第64-69页 |
·优化单个数组访问的空间局部性 | 第64-66页 |
·优化多个数组访问的空间局部性 | 第66-67页 |
·优化已具有时间局部性的数组访问的空间局部性 | 第67-69页 |
§3.3 同时优化数组访问的时间局部性与空间局部性 | 第69-72页 |
§3.4 构造既满足数据相关性限制又能优化局部性的循环变换矩阵 | 第72-75页 |
§3.5 与相关工作的比较 | 第75-76页 |
§3.6 本章小结 | 第76-77页 |
第四章 结合循环变换与数据变换技术的cache局部性优化 | 第77-99页 |
§4.1 数据的最优存储布局 | 第78-81页 |
§4.2 TMLG及其构造方法 | 第81-88页 |
·子嵌套循环 | 第81-83页 |
·RNG和RLG的构造 | 第83-85页 |
·TMLG | 第85-87页 |
·结点代价 | 第87-88页 |
§4.3 基于0-1整数规划的全局局部性优化问题求解 | 第88-93页 |
·问题描述 | 第88页 |
·整数变量与目标函数 | 第88-89页 |
·限制条件 | 第89-91页 |
·例子 | 第91-93页 |
·条件控制语句和动态数据布局 | 第93页 |
§4.4 与相关工作的比较 | 第93-94页 |
§4.5 本章小结 | 第94-99页 |
第五章 内存局部性优化 | 第99-161页 |
§5.1 基于数据空间融合的计算与数据划分方法总揽 | 第100-104页 |
§5.2 划分计算空间 | 第104-111页 |
·求解距离向量空间 | 第105-107页 |
·线性计算划分 | 第107-111页 |
§5.3 数据空间的划分与融合 | 第111-132页 |
·线性数据划分 | 第111-114页 |
·线性数据划分的标准形式 | 第114-117页 |
·数据复制 | 第117-119页 |
·数据空间的融合 | 第119-125页 |
·线性数据划分的相容标准形式 | 第125-132页 |
§5.4 计算与数据到虚拟处理器空间的映射 | 第132-141页 |
·情形一 | 第132-134页 |
·情形二 | 第134-137页 |
·情形三 | 第137-138页 |
·举例 | 第138-141页 |
§5.5 多个嵌套循环的计算与数据划分方法 | 第141-152页 |
§5.6 代码变换 | 第152-156页 |
§5.7 与相关工作的比较 | 第156-159页 |
§5.8 本章小结 | 第159-161页 |
第六章 提高局部性并同时消除伪共享 | 第161-176页 |
§6.1 优化空间局部性 | 第162页 |
§6.2 消除伪共享 | 第162-173页 |
·并行外层循环 | 第163-170页 |
·并行最内层循环 | 第170-173页 |
§6.3 多个数组的局部性提高与伪共享消除 | 第173-174页 |
§6.4 与相关工作的比较 | 第174-175页 |
§6.5 本章小结 | 第175-176页 |
第七章 数据局部性编译器原型系统及实验结果 | 第176-195页 |
§7.1 数据局部性编译器原型系统 | 第176-180页 |
·SUIF2编译器简介 | 第176-177页 |
·Pass编程简介 | 第177-178页 |
·原型系统 | 第178-180页 |
§7.2 实验结果 | 第180-194页 |
·第二章实验结果 | 第180-182页 |
·第三章实验结果 | 第182-184页 |
·第四章实验结果 | 第184-189页 |
·第五章实验结果 | 第189-192页 |
·第六章实验结果 | 第192-194页 |
§7.3 本章小结 | 第194-195页 |
第八章 结束语 | 第195-198页 |
§8.1 工作总结 | 第195-196页 |
§8.2 研究展望 | 第196-198页 |
攻读博士学位期间发表的论文 | 第198-199页 |
攻读博士学位期间参与的科研项目 | 第199-200页 |
致谢 | 第200-201页 |
参考文献 | 第201-207页 |