首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--存贮器论文

面向共享存储系统的计算模型及性能优化

摘要第1-7页
ABSTRACT第7-9页
目录第9-16页
第1章 绪论第16-34页
   ·并行计算的基本概念第16-17页
     ·研究背景第16页
     ·研究内容第16-17页
   ·并行计算机体系结构第17-19页
     ·基本概念第17-18页
     ·共享存储体系结构第18页
     ·分布存储体系结构第18-19页
     ·主流的并行计算机体系结构第19页
   ·并行算法理论第19-22页
     ·基本概念第19-20页
     ·并行计算模型第20页
     ·并行算法设计技术第20-21页
     ·并行算法性能度量第21-22页
   ·并行编程环境第22-23页
     ·基本概念第22页
     ·数据并行模型第22页
     ·共享变量模型第22-23页
     ·消息传递模型第23页
     ·新型的并行编程语言第23页
   ·并行应用性能优化技术第23-26页
     ·并行应用的现状第23-24页
     ·性能优化过程第24-25页
     ·性能优化工具第25页
     ·性能优化方法第25-26页
   ·并行计算的发展现状第26-28页
     ·国外的并行计算发展第26-27页
     ·国内的并行计算发展第27-28页
   ·并行计算存在的问题和不足第28-29页
   ·论文研究思路、内容和成果第29-31页
   ·论文组织结构第31-32页
   ·本章小结第32-34页
第2章 分层并行计算模型第34-54页
   ·并行计算模型相关工作第34-45页
     ·基本概念第34-36页
     ·N体问题及其串行算法第36页
     ·共享存储模型第36-39页
     ·分布存储模型第39-43页
     ·考虑存储访问的模型第43-45页
   ·分层的并行计算模型第45-52页
     ·单一模型存在的问题第45-46页
     ·分层模型的概念第46-48页
     ·并行算法设计模型第48-49页
     ·并行程序设计模型第49-50页
     ·并行程序执行模型第50-52页
   ·本章小结第52-54页
第3章 SMP系统上消息传递优化技术第54-64页
   ·研究背景第54-58页
     ·MPI消息传递协议第54-55页
     ·SMP系统介绍第55页
     ·MPI在SMP系统上缺点第55-57页
     ·相关工作第57-58页
   ·SMP系统上通信优化技术第58-63页
     ·单次数据复制技术第58-59页
     ·自旋等待同步策略第59-60页
     ·消息传递性能分析第60页
     ·实验与分析第60-62页
     ·实际应用的优化第62-63页
   ·本章小结第63-64页
第4章 SMP系统上Mfold的并行优化第64-74页
   ·串行Mfold算法介绍第64-66页
     ·RNA二级结构预测第64-65页
     ·Mfold中的串行预测算法第65-66页
   ·并行Mfold及优化第66-69页
     ·并行Mfold实现及分析第66-67页
     ·并行Mfold的优化第67-69页
   ·实验结果及性能分析第69-71页
     ·实验配置第69页
     ·结果与分析第69-71页
   ·本章小结第71-74页
第5章 CMP系统上基于内容的图像检索系统的并行优化第74-96页
   ·研究背景第74-80页
     ·基于内容的图像检索背景第74-75页
     ·多核技术介绍第75-79页
     ·OpenMP编程模型第79-80页
   ·基于内容的图像检索系统实现第80-83页
     ·特征抽取第81-82页
     ·高维向量降维第82页
     ·候选图像集合构造第82-83页
     ·相似度匹配和结果排序第83页
   ·挖掘CBIR的多级并行性第83-87页
     ·优化指令级并行性第83-84页
     ·优化数据级并行性第84-85页
     ·优化线程级并行性第85-87页
   ·实验及分析第87-94页
     ·实验配置第87-88页
     ·系统响应速度优化结果第88页
     ·性能差异分析第88-90页
     ·加速比分析第90-94页
   ·本章小结第94-96页
第6章 面向CMP的定量化程序执行模型CRAM(h)第96-116页
   ·程序性能评测第96-99页
     ·研究背景第96-97页
     ·相关工作第97-99页
   ·多核系统关键因素分析第99-103页
     ·处理器指令执行第99-100页
     ·存储器访问第100-101页
     ·并行性第101-103页
   ·定量化的执行模型CRAM(h)第103-106页
     ·执行时间模型第103-104页
     ·平均访存时间模型第104-105页
     ·并行性相关参数第105页
     ·性能剖析技术第105-106页
   ·模型验证第106-113页
     ·实验环境第106页
     ·存储系统参数第106-109页
     ·矩阵相乘的局部性分析第109-112页
     ·性能模型的评价第112-113页
   ·本章小结第113-116页
第7章 总结与展望第116-120页
   ·本文总结第116-118页
   ·进一步工作第118-120页
参考文献第120-130页
致谢第130-132页
攻读博士学位期间发表的学术论文与参加的科研项目第132-133页

论文共133页,点击 下载论文
上一篇:量子计算中的新计算模式和新物理实现体系研究
下一篇:分片式流处理器体系结构