目录 | 第1-11页 |
摘要 | 第11-13页 |
Abstract | 第13-15页 |
第一章 引言 | 第15-33页 |
·多媒体扩展指令集 | 第15-17页 |
·SIMD编译优化的意义 | 第17-19页 |
·SIMD编译优化的内容 | 第19-26页 |
·SIMD编译优化的层次 | 第19-20页 |
·SIMD编译优化的要求 | 第20-21页 |
·SIMD编译优化的主要内容 | 第21-26页 |
·主要的相关研究工作 | 第26-31页 |
·经典向量化 | 第26-28页 |
·相关的SIMD编译优化研究 | 第28-31页 |
·本文的贡献及结构安排 | 第31-33页 |
第二章 多媒体扩展指令集分析 | 第33-53页 |
·多媒体扩展与传统向量机的区别 | 第33-37页 |
·向量差异 | 第33-35页 |
·内存差异 | 第35页 |
·指令集差异 | 第35-37页 |
·Intel MMX/SSE/SSE2/SSE3指令集简介 | 第37-53页 |
·Intel多媒体扩展指令集发展简史 | 第37页 |
·Intel MMX/SSE/SSE2/SSE3指令简介 | 第37-50页 |
·结论 | 第50-53页 |
第三章 多媒体程序特性分析 | 第53-67页 |
·程序包简介 | 第53-55页 |
·多媒体程序运行时特点 | 第55-56页 |
·多媒体扩展指令集对多媒体程序的效果 | 第56-58页 |
·代码形式特点 | 第58-65页 |
·广泛使用指针进行运算 | 第59页 |
·大量的循环展开 | 第59页 |
·多媒体典型操作的变体很多 | 第59-63页 |
·使用映射数组替代复杂计算 | 第63-64页 |
·普遍使用宽数据类型 | 第64-65页 |
·各种代码形式在BMW中的出现情况 | 第65页 |
·结论 | 第65-67页 |
第四章 SIMD编译优化的框架 | 第67-89页 |
·传统向量化概述 | 第67-72页 |
·BURS代码生成技术概述 | 第72-75页 |
·SIMD编译优化基本思想 | 第75-85页 |
·对经典向量化算法的改进 | 第77-79页 |
·识别可向量化代码块的基本思想 | 第79-85页 |
·概念定义 | 第85-87页 |
·基本算法 | 第87-89页 |
第五章 代码规范化 | 第89-109页 |
·经典代码规范化方法 | 第89-92页 |
·指针变数组 | 第92-93页 |
·循环折叠 | 第93-98页 |
·进一步的探讨 | 第98页 |
·变量位宽分析 | 第98-101页 |
·IF-Conversion | 第101-103页 |
·映射数组变换 | 第103-109页 |
第六章 可向量化代码块的识别与选取 | 第109-125页 |
·CVP_Set的计算 | 第109-113页 |
·匹配信息的计算 | 第110-112页 |
·匹配实例 | 第112-113页 |
·MVP的寻找和计算 | 第113-118页 |
·MVP规则示例 | 第113-115页 |
·MVP的寻找 | 第115-118页 |
·向量化策略的选取 | 第118-124页 |
·代码生成 | 第124-125页 |
第七章 进一步的优化 | 第125-133页 |
·Alignment分析 | 第125-128页 |
·SIMD寄存器使用分析 | 第128-130页 |
·规约变量的额外处理 | 第130-131页 |
·窥孔优化 | 第131-133页 |
第八章 实现与测试 | 第133-145页 |
·系统实现 | 第133-134页 |
·系统中的向量化规则 | 第134-138页 |
·简单算术运算规则 | 第134页 |
·内存访问规则 | 第134-136页 |
·MVP规则 | 第136页 |
·规约计算规则 | 第136-137页 |
·溢出控制下的运算规则 | 第137页 |
·其他辅助规则 | 第137-138页 |
·Agassiz中的规则总结 | 第138页 |
·测试结果 | 第138-145页 |
·测试环境与方法 | 第138-139页 |
·测试结果 | 第139-141页 |
·运行时性能指标比较 | 第141-143页 |
·映射数组的识别效果 | 第143-145页 |
第九章 总结与展望 | 第145-149页 |
·结论 | 第145-147页 |
·将来的工作 | 第147-149页 |
参考文献 | 第149-157页 |
发表文章目录 | 第157-159页 |
致谢 | 第159-160页 |
论文独创性声明 | 第160页 |
论文使用授权声明 | 第160页 |