| 图索引 | 第1-9页 |
| 表索引 | 第9-10页 |
| 摘要 | 第10-12页 |
| ABSTRACT | 第12-15页 |
| 第一章 绪论 | 第15-30页 |
| §1.1 课题研究背景 | 第15-17页 |
| ·处理器与存储器的性能差异 | 第15-16页 |
| ·层次存储系统 | 第16-17页 |
| ·局部性 | 第17页 |
| §1.2 课题研究内容 | 第17-21页 |
| ·课题来源 | 第17页 |
| ·课题研究重点 | 第17-21页 |
| ·课题研究难点 | 第21页 |
| §1.3 相关研究工作 | 第21-26页 |
| ·cache局部性优化方面的相关研究工作 | 第21-23页 |
| ·内存局部性优化方面的相关研究工作 | 第23-25页 |
| ·伪共享消除方面的相关研究工作 | 第25-26页 |
| §1.4 本文的主要工作和创新 | 第26-28页 |
| §1.5 基本术语 | 第28-29页 |
| §1.6 论文结构 | 第29-30页 |
| 第二章 基于数据变换技术的cache局部性优化 | 第30-58页 |
| §2.1 数据访问轨迹 | 第31-34页 |
| §2.2 基于投影分层技术的数据变换框架 | 第34-36页 |
| §2.3 优化具有类仿射下标数组的空间局部性 | 第36-51页 |
| ·空间局部性优化问题求解 | 第36-48页 |
| ·时间局部性 | 第48页 |
| ·松耦合嵌套循环 | 第48-49页 |
| ·多个嵌套循环 | 第49页 |
| ·无冲突访问判别条件 | 第49-51页 |
| ·减少数据变换所需的额外存储空间 | 第51页 |
| §2.4 优化具有复杂下标数组的空间局部性 | 第51-56页 |
| §2.5 与相关工作的比较 | 第56-57页 |
| §2.6 本章小结 | 第57-58页 |
| 第三章 基于循环变换技术的cache局部性优化 | 第58-77页 |
| §3.1 优化时间局部性 | 第59-64页 |
| ·优化单个数组访问的时间局部性 | 第59-62页 |
| ·优化多个数组访问的时间局部性 | 第62-64页 |
| §3.2 优化空间局部性 | 第64-69页 |
| ·优化单个数组访问的空间局部性 | 第64-66页 |
| ·优化多个数组访问的空间局部性 | 第66-67页 |
| ·优化已具有时间局部性的数组访问的空间局部性 | 第67-69页 |
| §3.3 同时优化数组访问的时间局部性与空间局部性 | 第69-72页 |
| §3.4 构造既满足数据相关性限制又能优化局部性的循环变换矩阵 | 第72-75页 |
| §3.5 与相关工作的比较 | 第75-76页 |
| §3.6 本章小结 | 第76-77页 |
| 第四章 结合循环变换与数据变换技术的cache局部性优化 | 第77-99页 |
| §4.1 数据的最优存储布局 | 第78-81页 |
| §4.2 TMLG及其构造方法 | 第81-88页 |
| ·子嵌套循环 | 第81-83页 |
| ·RNG和RLG的构造 | 第83-85页 |
| ·TMLG | 第85-87页 |
| ·结点代价 | 第87-88页 |
| §4.3 基于0-1整数规划的全局局部性优化问题求解 | 第88-93页 |
| ·问题描述 | 第88页 |
| ·整数变量与目标函数 | 第88-89页 |
| ·限制条件 | 第89-91页 |
| ·例子 | 第91-93页 |
| ·条件控制语句和动态数据布局 | 第93页 |
| §4.4 与相关工作的比较 | 第93-94页 |
| §4.5 本章小结 | 第94-99页 |
| 第五章 内存局部性优化 | 第99-161页 |
| §5.1 基于数据空间融合的计算与数据划分方法总揽 | 第100-104页 |
| §5.2 划分计算空间 | 第104-111页 |
| ·求解距离向量空间 | 第105-107页 |
| ·线性计算划分 | 第107-111页 |
| §5.3 数据空间的划分与融合 | 第111-132页 |
| ·线性数据划分 | 第111-114页 |
| ·线性数据划分的标准形式 | 第114-117页 |
| ·数据复制 | 第117-119页 |
| ·数据空间的融合 | 第119-125页 |
| ·线性数据划分的相容标准形式 | 第125-132页 |
| §5.4 计算与数据到虚拟处理器空间的映射 | 第132-141页 |
| ·情形一 | 第132-134页 |
| ·情形二 | 第134-137页 |
| ·情形三 | 第137-138页 |
| ·举例 | 第138-141页 |
| §5.5 多个嵌套循环的计算与数据划分方法 | 第141-152页 |
| §5.6 代码变换 | 第152-156页 |
| §5.7 与相关工作的比较 | 第156-159页 |
| §5.8 本章小结 | 第159-161页 |
| 第六章 提高局部性并同时消除伪共享 | 第161-176页 |
| §6.1 优化空间局部性 | 第162页 |
| §6.2 消除伪共享 | 第162-173页 |
| ·并行外层循环 | 第163-170页 |
| ·并行最内层循环 | 第170-173页 |
| §6.3 多个数组的局部性提高与伪共享消除 | 第173-174页 |
| §6.4 与相关工作的比较 | 第174-175页 |
| §6.5 本章小结 | 第175-176页 |
| 第七章 数据局部性编译器原型系统及实验结果 | 第176-195页 |
| §7.1 数据局部性编译器原型系统 | 第176-180页 |
| ·SUIF2编译器简介 | 第176-177页 |
| ·Pass编程简介 | 第177-178页 |
| ·原型系统 | 第178-180页 |
| §7.2 实验结果 | 第180-194页 |
| ·第二章实验结果 | 第180-182页 |
| ·第三章实验结果 | 第182-184页 |
| ·第四章实验结果 | 第184-189页 |
| ·第五章实验结果 | 第189-192页 |
| ·第六章实验结果 | 第192-194页 |
| §7.3 本章小结 | 第194-195页 |
| 第八章 结束语 | 第195-198页 |
| §8.1 工作总结 | 第195-196页 |
| §8.2 研究展望 | 第196-198页 |
| 攻读博士学位期间发表的论文 | 第198-199页 |
| 攻读博士学位期间参与的科研项目 | 第199-200页 |
| 致谢 | 第200-201页 |
| 参考文献 | 第201-207页 |