首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

GPU通用计算虚拟化方法研究

摘要第1-6页
Abstract第6-8页
目录第8-11页
插图索引第11-12页
附表索引第12-13页
第一章 绪论第13-23页
   ·课题研究背景及意义第13-16页
   ·国内外研究现状第16-20页
   ·论文的主要工作及组织结构第20-21页
   ·本章小结第21-23页
第二章 GPU通用计算和系统虚拟化相关研究第23-35页
   ·GPU通用计算第23-27页
     ·基于图形API的GPU通用计算第23-25页
     ·基于独立API的GPU通用计算第25-27页
   ·系统级虚拟机与GPU虚拟化第27-34页
     ·设备仿真法第28-29页
     ·独占设备法第29-30页
     ·API重定向法第30-31页
     ·GPU虚拟化方案总结第31-34页
   ·本章小结第34-35页
第三章 vCUDA的设计与实现第35-61页
   ·VCUDA设计第35-36页
   ·VCUDA实现第36-42页
     ·vCUDA库(vCUDA library)第37-40页
     ·虚拟GPU(vGPU)第40页
     ·vCUDA服务器(vCUDA stub)第40-42页
   ·追踪CUDA状态第42-46页
     ·虚拟对象列表(VOL)第43-44页
     ·API虚拟化方案第44-45页
     ·懒惰传输第45-46页
   ·VCUDA虚拟化示例:矩阵乘法第46-51页
     ·CUDA对象虚拟化第48-50页
     ·CUDA对象的识别第50页
     ·本地替代API第50页
     ·懒惰RPC第50-51页
   ·VCUDA对虚拟机高级特性的支持第51-54页
     ·多机并发第51-53页
     ·暂停/恢复第53-54页
   ·实验性能第54-58页
     ·基本性能第55-56页
     ·懒惰RPC第56-57页
     ·多机并发第57页
     ·暂停和恢复第57-58页
     ·第三方CUDA程序第58页
   ·本章小结第58-61页
第四章 VMRPC的设计与实现第61-83页
   ·设计思路第61-65页
     ·传统RPC系统在虚拟环境中的缺陷第61-62页
     ·本地RPC优化第62页
     ·虚拟机域间通信第62-63页
     ·域间通信优化第63页
     ·VMRPC设计目标第63-65页
   ·VMRPC实现第65-70页
     ·内存映射第66-67页
     ·传输通道第67-68页
     ·控制通道第68-69页
     ·异步通道第69-70页
   ·VMRPC用户接口第70-72页
   ·VMRPC与传统RPC框架的差异第72-74页
   ·实验性能第74-82页
     ·延迟第75-76页
     ·吞吐量第76-78页
     ·CPU占用率第78页
     ·VMRPC与XENLOOP的比较第78-79页
     ·VMRPC的应用:stfufs文件系统第79-82页
   ·本章小结第82-83页
第五章 IKC核内检查点技术的设计与实现第83-105页
   ·提高GPU容错能力的必要性第83-85页
   ·现有的GPU容错技术第85-89页
     ·基于复制的GPU容错方法第85-87页
     ·基于检查点的GPU容错方法第87-89页
   ·CPU+GPU混合计算架构第89-92页
   ·GPU核外检查点技术的不足第92-94页
   ·GPU核内检查点技术的实现第94-100页
     ·技术支撑第94页
     ·实现方案第94-97页
     ·整体框架第97-100页
   ·性能分析第100-103页
     ·运行时开销第101-102页
     ·检查开销第102页
     ·恢复开销第102-103页
   ·本章小结第103-105页
总结与展望第105-107页
参考文献第107-114页
附录第114-116页
致谢第116-117页

论文共117页,点击 下载论文
上一篇:基于q-gram过滤的近似串匹配技术研究
下一篇:可信P2P流媒体关键技术研究