计算系统的并行化和映射问题研究
摘要 | 第1-5页 |
ABSTRACT | 第5-7页 |
目录 | 第7-9页 |
插图目录 | 第9-11页 |
图表目录 | 第11-12页 |
缩略词说明表 | 第12-14页 |
1 绪论 | 第14-21页 |
·NoC概述 | 第15-16页 |
·NoC面临的问题 | 第16页 |
·NoC软件并行化问题 | 第16-17页 |
·软硬件协同设计 | 第17-19页 |
·软硬件传统设计方法 | 第17-18页 |
·现在的软硬件协同设计方法 | 第18-19页 |
·软硬件划分 | 第19页 |
·论文结构 | 第19-20页 |
·课题来源 | 第20-21页 |
2 层次化NoC上的应用级并行化 | 第21-31页 |
·本章概述 | 第21-22页 |
·NoC多核处理器 | 第22-25页 |
·H~3MP概述 | 第22-23页 |
·通信 | 第23-25页 |
·相关工作 | 第25页 |
·软件模型 | 第25-27页 |
·细粒度模型 | 第25-26页 |
·粗粒度模型 | 第26-27页 |
·实现结果与比较 | 第27-30页 |
·细粒度模型结果 | 第27-29页 |
·粗粒度模型结果 | 第29-30页 |
·本章小结 | 第30-31页 |
3 通用并行编程模型 | 第31-52页 |
·本章概述 | 第31-33页 |
·AC多模匹配算法 | 第33-39页 |
·算法描述 | 第33-36页 |
·AC多模匹配任务流 | 第36-39页 |
·OpenMP模型 | 第39-43页 |
·OpenMP描述 | 第39-40页 |
·OpenMP实验结果 | 第40-43页 |
·Pthread模型 | 第43-44页 |
·GPGPU模型 | 第44-50页 |
·CUDA描述 | 第45页 |
·查找表的存储 | 第45-48页 |
·数据块的划分 | 第48-49页 |
·CUDA运行结果 | 第49-50页 |
·基于NoC的并行通用编程模型 | 第50-51页 |
·本章小结 | 第51-52页 |
4 基于蚁群混沌遗传算法的片上网络映射 | 第52-63页 |
·本章概述 | 第52-53页 |
·相关工作 | 第53-54页 |
·NoC映射模型 | 第54-60页 |
·映射过程 | 第54页 |
·能耗和延时模型 | 第54-56页 |
·蚁群遗传算法 | 第56-60页 |
·实验与分析 | 第60-62页 |
·MPEG4解码器任务图 | 第60-61页 |
·随机任务图 | 第61-62页 |
·本章小结 | 第62-63页 |
5 总结与展望 | 第63-65页 |
·本文总结 | 第63-64页 |
·未来工作展望 | 第64-65页 |
致谢 | 第65-67页 |
参考文献 | 第67-70页 |
附录 | 第70-73页 |
攻读学位期间发表的文章 | 第70页 |
攻读学位期间申请的专利 | 第70-71页 |
攻读学位期间参加的项目 | 第71-73页 |