首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

高通量众核并行模拟加速技术研究

摘要第5-6页
Abstract第6-7页
第1章 绪论第14-30页
    1.1 研究背景和意义第14-18页
        1.1.1 大数据应用对体系结构设计方法提出新要求第14-16页
        1.1.2 高通量系统与高性能系统的对比第16-17页
        1.1.3 高通量系统对模拟器设计提出新要求第17-18页
    1.2 BDSim并行模拟框架第18-22页
        1 2.1 并行离散事件模拟算法第18-19页
        1.2.2 BDSim并行模拟框架第19-22页
    1.3 BDSim模拟框架的不足第22-28页
        1.3.1 BDSim模拟框架并行性能表现第22-24页
        1.3.2 锁操作开销第24页
        1.3.3 负载均衡性第24-26页
        1.3.4 CMB同步算法第26-27页
        1.3.5 动态内存管理第27-28页
    1.4 论文研究目标和主要工作第28-29页
        1.4.1 以查找表技术加速指令译码第28页
        1.4.2 多角度优化的并行离散事件模拟框架第28-29页
    1.5 论文结构第29-30页
第2章 模拟器性能优化技术第30-38页
    2.1 提高单条指令或指令块的模拟速度第30-32页
        2.1.1 二进制翻译第30-31页
        2.1.2 直接执行第31页
        2.1.3 FPGA仿真第31-32页
        2.1.4 其他技术第32页
    2.2 减少模拟指令数第32-34页
        2.2.1 精简输入集技术第32-33页
        2.2.2 截短模拟执行技术第33页
        2.2.3 采样技术第33-34页
    2.3 利用硬件平台并行性和提高模拟算法并发度第34-37页
        2.3.1 并行化的硬件资源第35页
        2.3.2 高并发度的模拟算法第35-37页
    2.4 本章总结第37-38页
第3章 查找表技术加速指令译码第38-46页
    3.1 PopCount问题第38-40页
        3.1.1 遍历计数算法第38-39页
        3.1.2 查找表技术解决PopCount问题第39-40页
    3.2 指令条件域检查第40-42页
        3.2.1 原始算法第41页
        3.2.2 查找表技术实现指令条件域检查第41-42页
    3.3 查找表技术模拟踪迹缓存第42-43页
    3.4 查找表解决PopCount问题的实验验证第43-45页
        3.4.1 实验设计第43页
        3.4.2 计算时间与查找表尺寸的关系第43页
        3.4.3 不同算法加速效果对比第43-44页
        3.4.4 实验总结第44-45页
    3.5 本章总结第45-46页
第4章 多角度优化的并行离散事件模拟框架第46-60页
    4.1 无锁化设计的未来事件队列第46-48页
    4.2 基于随机映射策略的事件调度算法第48-50页
    4.3 基于cycle-by-cycle模型的时间推进算法第50-52页
    4.4 基于内存池的消息存储空间管理方案第52-54页
    4.5 实验验证第54-58页
        4.5.1 动态映射方案的负载均衡性第54-56页
        4.5.2 内存池管理方案加速效果第56-57页
        4.5.3 总体性能收益第57-58页
    4.6 本章总结第58-60页
第5章 论文总结第60-62页
    5.1 研究工作总结第60-61页
        5.1.1 分析高通量处理器特征,总结常用模拟加速技术第60页
        5.1.2 千核万线程规模的模拟加速第60-61页
    5.2 未来工作展望第61-62页
参考文献第62-66页
致谢第66-68页
在读期间发表的学术论文与取得的其他研究成果第68页
    1. 发表论文第68页
    2. 技术报告第68页
    3. 科研项目第68页

论文共68页,点击 下载论文
上一篇:基于静态分析的Android动态测试方法研究
下一篇:基于Linux容器构建网络功能虚拟化平台