首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--编译程序、解释程序论文

基于Streamit编译器的异构执行环境研究

摘要第1-5页
Abstract第5-10页
第1章 研究意义第10-20页
   ·全新的并行编程成为未来程序设计趋势第10-11页
   ·并行模型与硬件架构、存储结构息息相关第11-14页
   ·并行模型中的若干软件设计因素第14-15页
   ·Streamit+GPU让问题变得简单、性能得到提升第15-16页
   ·本文主要研究内容第16-20页
     ·本文主要研究内容第16-18页
     ·本文主要贡献第18-19页
     ·论文组织与各章内容简介第19-20页
第2章 Streamit研究现状第20-29页
   ·本章引言第20-21页
   ·Streamit开发小组的工作第21-24页
     ·Streamit前期工作第21-23页
     ·Streamit中期工作第23-24页
     ·Streamit目前工作第24页
   ·Streamit的其它工作第24-28页
     ·面向Cell、多核以及FPGA处理器第25-26页
     ·基于GPU的Streamit与基于GPU的优化问题第26-28页
   ·本章小结第28-29页
第3章 Streamit编程、特点及模型分析第29-59页
   ·本章引言第29-30页
   ·流程序介绍第30-33页
     ·离散时间傅里叶变换DTFT第31-32页
     ·多通道滤波器设计第32页
     ·离散余弦变换DCT第32页
     ·数据加密算法DES第32-33页
     ·视频编码标准MPEG2第33页
   ·前端编译第33-36页
   ·后端编译第36-47页
     ·pop、peek与push操作第37-38页
     ·静态流图与动态调度第38-39页
     ·节点线性化第39-40页
     ·Streamit调度系统与操作系统调度第40-41页
     ·代码生成第41-42页
     ·典型应用程序执行流图及相关数据统计第42-47页
   ·多核与众核平台第47-49页
     ·多核简述第48页
     ·众核简述第48页
     ·多核与众核关系第48-49页
   ·checkpoint操作第49页
   ·编译中间件第49-52页
     ·Antlr介绍第50-51页
     ·画图软件Dotty第51-52页
   ·模型分析第52-57页
     ·MPI+CUDA第53-56页
     ·并行设计语言Streamit第56-57页
     ·面向异构平台的并行设计语言Streamit+GPU第57页
   ·本章小结第57-59页
第4章 平台无关的数据依赖检测与分离技术第59-68页
   ·本章引言第59页
   ·问题提出第59-60页
   ·问题解决第60-66页
     ·pop、push与缓冲区映射第61-62页
     ·其它依赖检测与并行化技术第62-66页
   ·本章小结第66-68页
第5章 方案设计与实现第68-82页
   ·本章引言第68-69页
   ·可选方案对比第69-71页
     ·方案一:全节点转换第69-70页
     ·方案二:流图转换第70页
     ·方案三:循环语句转换第70-71页
   ·解决方案与实现细节第71-80页
     ·总体解决方案第71-72页
     ·前端设计第72-73页
     ·后端处理第73-80页
   ·本章小结第80-82页
第6章 代码转换第82-96页
   ·本章引言第82-84页
   ·影响代码性能的若干因素第84-85页
   ·代码转换对比第85页
   ·信息获取第85-86页
   ·循环模式的代码转换方案第86-91页
     ·循环语句的生成策略简述第87-89页
     ·准备工作第89页
     ·循环层数为1、步长为1时的循环语句处理第89页
     ·循环层数为1、步长为2或者n时的循环语句处理第89-90页
     ·循环层数为2、步长为1时的循环语句处理第90-91页
     ·循环层数为2、步长为2或者n时的处理第91页
     ·结尾工作第91页
   ·代码转换优化第91-94页
     ·存储空间优化第92-94页
     ·函数优化第94页
   ·本章小结第94-96页
第7章 结果分析与性能改进第96-119页
   ·本章引言第96页
   ·实验步骤第96-111页
     ·基于矩阵相乘的多核、GPU计算平台对比第97-98页
     ·多核下各种流水线执行特点分析实验第98-107页
     ·流水线优化措施与实验分析第107-110页
     ·异构执行与多核执行性能对比第110-111页
   ·性能改进与模型扩展第111-117页
     ·提出背景第112-114页
     ·基于多输入、多输出端口的扩展Streamit编程框架第114-116页
     ·基于多输入、多输出端口的模拟实验第116-117页
   ·本章小结第117-119页
第8章 总结与进一步工作第119-123页
   ·本文总结第119-121页
   ·进一步工作第121-123页
参考文献第123-131页
致谢第131-132页
个人简历、在学期间发表的学术论文与研究成果第132-133页

论文共133页,点击 下载论文
上一篇:基于单目视觉的三维刚体目标测量技术研究
下一篇:中国社会阶层地位对政治参与的影响--以中国基层人大代表选举为例