首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--各种电子数字计算机论文

高性能计算机若干关键问题研究

摘要第1-7页
Abstract第7-17页
第1章 绪论第17-31页
   ·并行计算和多核处理器第17-26页
     ·概述第17-18页
     ·并行计算机体系结构第18-19页
     ·多核处理器体系结构第19-21页
     ·并行程序设计模型第21-23页
     ·并行计算机存储结构模型第23-26页
   ·用多核处理器构建大规模并行计算机第26-27页
   ·研究内容及思路第27-28页
   ·文献资源第28-29页
   ·本文组织结构第29-31页
第2章 高速缓存一致性第31-53页
   ·Cache一致性问题第31-42页
     ·侦听技术第33-35页
     ·目录技术第35-38页
     ·令牌技术第38-39页
     ·MOSI协议第39-41页
     ·MOESI协议第41-42页
   ·一致性协议优化第42-46页
     ·硬件优化第43-44页
     ·软件优化第44页
     ·软硬结合优化第44-46页
   ·多核处理器(CMP)及Cache一致性第46-51页
     ·在多核处理器中实现Cache一致性第46-47页
     ·互连技术的影响第47-51页
   ·小结第51-53页
第3章 多核处理器Cache一致性及其包含与不包含第53-81页
   ·由多核处理器构建共享存储的并行系统(M-CMP)第53-56页
     ·层次化高速缓存一致性协议第53-54页
     ·写无效和写更新第54-56页
   ·在M-CMP系统中实现Cache一致性第56-61页
     ·令牌技术第57-58页
     ·目录技术第58-61页
   ·基于不包含策略的Cache一致性协议第61-68页
     ·片内高速缓存的包含(inclusive)性第62页
     ·协议实现第62-65页
     ·Cache块的分配与替换策略第65-66页
     ·实验第66-68页
   ·多核处理器中的包含与不包含第68-78页
     ·单核处理器中的包含与不包含第68-70页
     ·维护包含性第70-72页
     ·多核处理器中的非真包含第72-74页
     ·多核处理器中的不包含第74-75页
     ·实验及分析第75-78页
   ·小结第78-81页
第4章 多核处理器片上高速缓存系统性能研究第81-93页
   ·研究背景第81-83页
     ·龙芯3号处理器第81-82页
     ·龙芯3号片上L2 Cache第82-83页
   ·龙芯3号L2 Cache负载行为评测第83-88页
     ·评测方法第83-84页
     ·负载行为评测第84-88页
   ·龙芯3号L2 Cache设计空间探索第88-91页
     ·共享和私有L2 Cache第88-89页
     ·L2 Cache容量第89-90页
     ·L2 Cache体的不平衡访问第90-91页
   ·小结第91-93页
第5章 高性能计算机互连技术研究第93-107页
   ·背景第93-94页
   ·MPU互连结构第94-99页
     ·数学模型第94-95页
     ·设计实现第95-96页
     ·路由算法第96-97页
     ·对网络性能的理论分析第97-99页
   ·对MPU的并行仿真第99-104页
     ·模拟器架构第100-101页
     ·建立拓扑第101-102页
     ·对MPICH2的修改第102-104页
     ·仿真结果第104页
   ·小结第104-107页
第6章 KD-50-I万亿次计算机系统结构技术第107-139页
   ·KD-50-I万亿次计算机介绍第107-109页
     ·研究背景第107-108页
     ·技术路线第108-109页
     ·体系结构简介第109页
   ·KD-50-I万亿次计算机系统结构第109-112页
     ·总体结构第109-111页
     ·计算结点第111页
     ·处理单元第111-112页
     ·交换底板第112页
   ·KD-50-I万亿次计算机网络启动技术第112-118页
     ·RTL8169芯片第113-114页
     ·RTL8169收发原理第114-115页
     ·PMON中RTL8169驱动程序源代码研究第115-117页
     ·网络启动第117-118页
   ·文件系统及系统软件第118-120页
     ·文件系统第118-119页
     ·精简操作系统第119页
     ·编译/并行运行环境第119-120页
     ·数学库第120页
     ·资源管理和作业调度第120页
   ·通信协议分析和优化第120-124页
     ·点对点通信第120-121页
     ·网卡参数调整第121页
     ·任务卸载(TASK OFFLOAD)第121页
     ·全局通信路径优化算法第121-124页
   ·通信性能第124-126页
     ·点对点通信第124-125页
     ·全局通信第125-126页
   ·扫描电子显微成像计算程序在KD-50-I上的应用及优化第126-137页
     ·扫描电子显微镜的工作原理第126-128页
     ·Monte Carlo方法及其应用第128-129页
     ·扫描电子显微成像模拟第129-130页
     ·消息传递接口(MPI)第130-132页
     ·并行化成像模拟实现第132-134页
     ·性能优化第134-137页
   ·小结第137-139页
第7章 结束语第139-144页
   ·本文主要工作第139-141页
   ·本文主要贡献和创新点第141-142页
   ·进一步工作第142-144页
参考文献第144-159页
致谢第159-161页
攻读学位期间发表和录用的论文第161-162页
攻读学位期间参与的科研项目第162页

论文共162页,点击 下载论文
上一篇:自适应方向提升小波变换及应用
下一篇:类数据流驱动的分片式处理器体系结构