首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--运算器和控制器(CPU)论文

乱序处理器分支预测器性能建模

摘要第5-6页
Abstract第6页
第一章 绪论第10-16页
    1.1 课题背景与意义第10-11页
    1.2 国内外研究现状第11-12页
    1.3 研究内容与设计指标第12-13页
    1.4 论文组织第13-16页
第二章 分支预测器概述第16-26页
    2.1 分支预测器的发展过程第16-18页
    2.2 分支跳转方向的预测第18-21页
        2.2.1 Gshare分支预测器第18-19页
        2.2.2 Bimode分支预测器第19-20页
        2.2.3 Tournament分支预测器第20-21页
    2.3 分支目标地址的预测第21-23页
        2.3.1 返回地址栈第21-22页
        2.3.2 分支目标缓冲器第22页
        2.3.3 多目标缓存第22-23页
    2.4 流水线中分支预测的更新机制第23-24页
    2.5 本章小结第24-26页
第三章 基于Trace的分支预测仿真器第26-52页
    3.1 基于Gem5的分支指令流提取第27-32页
        3.1.1 Gem5环境搭建第27-29页
        3.1.2 指令执行过程第29-31页
        3.1.3 安卓应用分支Trace流的提取第31-32页
    3.2 分支预测仿真器搭建第32-43页
        3.2.1 2-bit饱和计数器第33-34页
        3.2.2 历史寄存器与模式历史表第34页
        3.2.3 分支目标缓冲器第34-36页
        3.2.4 多目标缓存第36-37页
        3.2.5 返回地址栈第37页
        3.2.6 Gshare仿真器第37-39页
        3.2.7 Bimode仿真器第39-41页
        3.2.8 Tournament仿真器第41-43页
    3.3 分支预测器缺失次数模型精度验证第43-49页
        3.3.1 SPEC CPU2000测试集交叉编译第43-45页
        3.3.2 预测精度对比第45-47页
        3.3.3 时间开销对比第47-49页
    3.4 基于Trace的仿真与解析模型的对比第49-51页
        3.4.1 基于熵的分支缺失次数模型第49页
        3.4.2 仿真精度对比第49-50页
        3.4.3 仿真时间对比第50-51页
    3.5 本章小结第51-52页
第四章 基于神经网络的分支确定时间模型第52-76页
    4.1 分支确定时间与其影响因素的相关性分析第52-57页
    4.2 分支确定时间及其影响因素的提取第57-63页
        4.2.1 平均分支确定时间的提取第58-59页
        4.2.2 关键路径长度分布的提取第59-60页
        4.2.3 指令混合比的提取第60-61页
        4.2.4 缓存缺失次数的提取第61-62页
        4.2.5 串行指令分布的提取第62-63页
    4.3 BP神经网络原理第63-65页
    4.4 神经网络的拓扑结构设计第65-67页
    4.5 模型精度验证第67-71页
        4.5.1 MobyBench测试集第67-68页
        4.5.2 K-means聚类算法第68页
        4.5.3 不同比例训练数据对神经网络模型精度的影响第68-69页
        4.5.4 典型Android应用在不同分支预测器配置下的模型精度第69-71页
    4.6 分支确定时间模型精度对比第71-75页
        4.6.1 与非线性拟合模型的精度对比第72-73页
        4.6.2 与精简假设模型的对比第73-75页
    4.7 本章小结第75-76页
第五章 分支预测器性能评估工具的设计第76-86页
    5.1 分支预测器性能评估工具的框架第76-77页
    5.2 分支预测器性能评估工具的实现第77-83页
        5.2.1 数据采集模块第78-79页
        5.2.2 聚类模块第79-80页
        5.2.3 神经网络训练模块第80-81页
        5.2.4 图形用户界面模块第81-83页
    5.3 分支预测器性能评估工具的执行流程第83-85页
        5.3.1 工具训练执行流程第84页
        5.3.2 工具使用执行流程第84-85页
        5.3.3 工具的应用场景第85页
    5.4 本章小结第85-86页
第六章 总结与展望第86-88页
    6.1 总结第86页
    6.2 展望第86-88页
致谢第88-90页
参考文献第90-93页

论文共93页,点击 下载论文
上一篇:基于FastDFS的云存储文件系统性能优化设计与实现
下一篇:基于DSP的EMIF接口的设计