摘要 | 第1-7页 |
ABSTRACT | 第7-9页 |
目录 | 第9-12页 |
图目录 | 第12-14页 |
表目录 | 第14-15页 |
第1章 绪论 | 第15-35页 |
·研究背景 | 第15-22页 |
·SIMD扩展及其应用 | 第15-18页 |
·SIMD扩展上的向量化方法 | 第18-21页 |
·非多媒体程序对SIMD向量化方法提出新的挑战 | 第21-22页 |
·相关工作 | 第22-30页 |
·传统的向量化方法 | 第22-24页 |
·超字并行 | 第24-26页 |
·对齐分析和优化 | 第26-28页 |
·其他 | 第28-30页 |
·课题研究内容 | 第30-33页 |
·课题意义 | 第30页 |
·课题主要研究和创新 | 第30-31页 |
·课题研究平台 | 第31-33页 |
·论文结构 | 第33-35页 |
第2章 非多媒体应用的程序特征 | 第35-53页 |
·SPEC CPU2000测试集合 | 第35页 |
·各种编译器对SPEC CPU2000的自动向量化 | 第35-38页 |
·SPEC CPU2000的核心循环特征 | 第38-52页 |
·核心循环的向量化特征 | 第38-40页 |
·影响SIMD向量化的四大要素 | 第40-41页 |
·被向量化的核心循环的特征 | 第41-43页 |
·未被向量化的核心循环的特征 | 第43-52页 |
·小结 | 第52-53页 |
第3章 传统向量化方法的改进 | 第53-81页 |
·研究动机 | 第53-54页 |
·对比相关工作 | 第54-55页 |
·改进算法的实现框架 | 第55-59页 |
·算法思想 | 第55-56页 |
·实现框架 | 第56-59页 |
·面临的难题 | 第59页 |
·SIMD并行性分析 | 第59-62页 |
·构造语句依赖图 | 第59-61页 |
·SIMD并行性分析 | 第61-62页 |
·SIMD收益分析 | 第62-71页 |
·基本块做为分析单位 | 第62-63页 |
·基本块并行性方案选择 | 第63-64页 |
·SIMD的代价模型 | 第64-71页 |
·SLP和VP相结合的算法 | 第71-74页 |
·部分SLP向量化 | 第71-72页 |
·选取候选语句 | 第72页 |
·SLP向量化策略 | 第72-74页 |
·SIMD向量化变换 | 第74-76页 |
·循环结构变换 | 第74页 |
·SIMD操作的生成 | 第74-76页 |
·测试结果和分析 | 第76-79页 |
·小结 | 第79-81页 |
第4章 基于局部数据重组的SIMD向量化方法 | 第81-105页 |
·研究动机 | 第81-83页 |
·对比相关工作 | 第83-85页 |
·算法的实现框架 | 第85-88页 |
·算法的核心思想 | 第85页 |
·实现的框架 | 第85-86页 |
·面临的难题 | 第86-88页 |
·合法性分析 | 第88-89页 |
·收益性分析 | 第89-97页 |
·向量化收益 | 第90-91页 |
·局部数据重组的收益分析 | 第91-97页 |
·重组方案 | 第97-99页 |
·基本方案 | 第97-98页 |
·调整方案 | 第98-99页 |
·重组变换 | 第99-100页 |
·测试结果和分析 | 第100-104页 |
·小结 | 第104-105页 |
第5章 SIMD向量化的预优化 | 第105-121页 |
·研究动机 | 第105页 |
·对比相关工作 | 第105-106页 |
·选择适当的循环 | 第106-109页 |
·判断条件 | 第106-107页 |
·测试结果 | 第107-109页 |
·结论 | 第109页 |
·对齐分析和优化 | 第109-118页 |
·对齐分析 | 第110-113页 |
·对齐优化 | 第113-116页 |
·测试结果 | 第116-118页 |
·结论 | 第118页 |
·小结 | 第118-121页 |
第6章 结束语 | 第121-125页 |
·全文总结 | 第121-123页 |
·未来的研究方向 | 第123-125页 |
参考文献 | 第125-129页 |
在读期间完成的学术论文 | 第129-131页 |
在读期间参加的研究项目 | 第131-133页 |
致谢 | 第133页 |