针对实际多媒体程序和多媒体扩展指令集的SIMD编译优化

目录	第1-11页
摘要	第11-13页
Abstract	第13-15页
第一章引言	第15-33页
·多媒体扩展指令集	第15-17页
·SIMD编译优化的意义	第17-19页
·SIMD编译优化的内容	第19-26页
·SIMD编译优化的层次	第19-20页
·SIMD编译优化的要求	第20-21页
·SIMD编译优化的主要内容	第21-26页
·主要的相关研究工作	第26-31页
·经典向量化	第26-28页
·相关的SIMD编译优化研究	第28-31页
·本文的贡献及结构安排	第31-33页
第二章多媒体扩展指令集分析	第33-53页
·多媒体扩展与传统向量机的区别	第33-37页
·向量差异	第33-35页
·内存差异	第35页
·指令集差异	第35-37页
·Intel MMX／SSE／SSE2／SSE3指令集简介	第37-53页
·Intel多媒体扩展指令集发展简史	第37页
·Intel MMX／SSE／SSE2／SSE3指令简介	第37-50页
·结论	第50-53页
第三章多媒体程序特性分析	第53-67页
·程序包简介	第53-55页
·多媒体程序运行时特点	第55-56页
·多媒体扩展指令集对多媒体程序的效果	第56-58页
·代码形式特点	第58-65页
·广泛使用指针进行运算	第59页
·大量的循环展开	第59页
·多媒体典型操作的变体很多	第59-63页
·使用映射数组替代复杂计算	第63-64页
·普遍使用宽数据类型	第64-65页
·各种代码形式在BMW中的出现情况	第65页
·结论	第65-67页
第四章 SIMD编译优化的框架	第67-89页
·传统向量化概述	第67-72页
·BURS代码生成技术概述	第72-75页
·SIMD编译优化基本思想	第75-85页
·对经典向量化算法的改进	第77-79页
·识别可向量化代码块的基本思想	第79-85页
·概念定义	第85-87页
·基本算法	第87-89页
第五章代码规范化	第89-109页
·经典代码规范化方法	第89-92页
·指针变数组	第92-93页
·循环折叠	第93-98页
·进一步的探讨	第98页
·变量位宽分析	第98-101页
·IF-Conversion	第101-103页
·映射数组变换	第103-109页
第六章可向量化代码块的识别与选取	第109-125页
·CVP_Set的计算	第109-113页
·匹配信息的计算	第110-112页
·匹配实例	第112-113页
·MVP的寻找和计算	第113-118页
·MVP规则示例	第113-115页
·MVP的寻找	第115-118页
·向量化策略的选取	第118-124页
·代码生成	第124-125页
第七章进一步的优化	第125-133页
·Alignment分析	第125-128页
·SIMD寄存器使用分析	第128-130页
·规约变量的额外处理	第130-131页
·窥孔优化	第131-133页
第八章实现与测试	第133-145页
·系统实现	第133-134页
·系统中的向量化规则	第134-138页
·简单算术运算规则	第134页
·内存访问规则	第134-136页
·MVP规则	第136页
·规约计算规则	第136-137页
·溢出控制下的运算规则	第137页
·其他辅助规则	第137-138页
·Agassiz中的规则总结	第138页
·测试结果	第138-145页
·测试环境与方法	第138-139页
·测试结果	第139-141页
·运行时性能指标比较	第141-143页
·映射数组的识别效果	第143-145页
第九章总结与展望	第145-149页
·结论	第145-147页
·将来的工作	第147-149页
参考文献	第149-157页
发表文章目录	第157-159页
致谢	第159-160页
论文独创性声明	第160页
论文使用授权声明	第160页