基于Streamit编译器的异构执行环境研究

摘要	第1-5页
Abstract	第5-10页
第1章研究意义	第10-20页
·全新的并行编程成为未来程序设计趋势	第10-11页
·并行模型与硬件架构、存储结构息息相关	第11-14页
·并行模型中的若干软件设计因素	第14-15页
·Streamit+GPU让问题变得简单、性能得到提升	第15-16页
·本文主要研究内容	第16-20页
·本文主要研究内容	第16-18页
·本文主要贡献	第18-19页
·论文组织与各章内容简介	第19-20页
第2章 Streamit研究现状	第20-29页
·本章引言	第20-21页
·Streamit开发小组的工作	第21-24页
·Streamit前期工作	第21-23页
·Streamit中期工作	第23-24页
·Streamit目前工作	第24页
·Streamit的其它工作	第24-28页
·面向Cell、多核以及FPGA处理器	第25-26页
·基于GPU的Streamit与基于GPU的优化问题	第26-28页
·本章小结	第28-29页
第3章 Streamit编程、特点及模型分析	第29-59页
·本章引言	第29-30页
·流程序介绍	第30-33页
·离散时间傅里叶变换DTFT	第31-32页
·多通道滤波器设计	第32页
·离散余弦变换DCT	第32页
·数据加密算法DES	第32-33页
·视频编码标准MPEG2	第33页
·前端编译	第33-36页
·后端编译	第36-47页
·pop、peek与push操作	第37-38页
·静态流图与动态调度	第38-39页
·节点线性化	第39-40页
·Streamit调度系统与操作系统调度	第40-41页
·代码生成	第41-42页
·典型应用程序执行流图及相关数据统计	第42-47页
·多核与众核平台	第47-49页
·多核简述	第48页
·众核简述	第48页
·多核与众核关系	第48-49页
·checkpoint操作	第49页
·编译中间件	第49-52页
·Antlr介绍	第50-51页
·画图软件Dotty	第51-52页
·模型分析	第52-57页
·MPI+CUDA	第53-56页
·并行设计语言Streamit	第56-57页
·面向异构平台的并行设计语言Streamit+GPU	第57页
·本章小结	第57-59页
第4章平台无关的数据依赖检测与分离技术	第59-68页
·本章引言	第59页
·问题提出	第59-60页
·问题解决	第60-66页
·pop、push与缓冲区映射	第61-62页
·其它依赖检测与并行化技术	第62-66页
·本章小结	第66-68页
第5章方案设计与实现	第68-82页
·本章引言	第68-69页
·可选方案对比	第69-71页
·方案一：全节点转换	第69-70页
·方案二：流图转换	第70页
·方案三：循环语句转换	第70-71页
·解决方案与实现细节	第71-80页
·总体解决方案	第71-72页
·前端设计	第72-73页
·后端处理	第73-80页
·本章小结	第80-82页
第6章代码转换	第82-96页
·本章引言	第82-84页
·影响代码性能的若干因素	第84-85页
·代码转换对比	第85页
·信息获取	第85-86页
·循环模式的代码转换方案	第86-91页
·循环语句的生成策略简述	第87-89页
·准备工作	第89页
·循环层数为1、步长为1时的循环语句处理	第89页
·循环层数为1、步长为2或者n时的循环语句处理	第89-90页
·循环层数为2、步长为1时的循环语句处理	第90-91页
·循环层数为2、步长为2或者n时的处理	第91页
·结尾工作	第91页
·代码转换优化	第91-94页
·存储空间优化	第92-94页
·函数优化	第94页
·本章小结	第94-96页
第7章结果分析与性能改进	第96-119页
·本章引言	第96页
·实验步骤	第96-111页
·基于矩阵相乘的多核、GPU计算平台对比	第97-98页
·多核下各种流水线执行特点分析实验	第98-107页
·流水线优化措施与实验分析	第107-110页
·异构执行与多核执行性能对比	第110-111页
·性能改进与模型扩展	第111-117页
·提出背景	第112-114页
·基于多输入、多输出端口的扩展Streamit编程框架	第114-116页
·基于多输入、多输出端口的模拟实验	第116-117页
·本章小结	第117-119页
第8章总结与进一步工作	第119-123页
·本文总结	第119-121页
·进一步工作	第121-123页
参考文献	第123-131页
致谢	第131-132页
个人简历、在学期间发表的学术论文与研究成果	第132-133页