| 致谢 | 第4-5页 |
| 摘要 | 第5-7页 |
| Abstract | 第7-8页 |
| 第1章 绪论 | 第14-22页 |
| 1.1 研究背景和动机 | 第14-15页 |
| 1.2 研究动态和现状 | 第15-19页 |
| 1.2.1 计算单元 | 第15-16页 |
| 1.2.2 数据预取单元 | 第16-17页 |
| 1.2.3 基于机器学习的体系结构研究 | 第17-19页 |
| 1.3 模拟器 | 第19-20页 |
| 1.4 论文贡献与内容安排 | 第20-22页 |
| 1.4.1 论文贡献 | 第20-21页 |
| 1.4.2 内容安排 | 第21-22页 |
| 第2章 数据感知的乘累加单元 | 第22-36页 |
| 2.1 引言 | 第22-24页 |
| 2.2 相关工作 | 第24-25页 |
| 2.3 系统实现 | 第25-29页 |
| 2.3.1 自适应乘累加结构 | 第26-29页 |
| 2.4 实验方法 | 第29-31页 |
| 2.5 实验结果 | 第31-35页 |
| 2.5.1 MAC单元性能分析 | 第31-33页 |
| 2.5.2 敏感度分析 | 第33-34页 |
| 2.5.3 时延和面积 | 第34-35页 |
| 2.6 本章小结 | 第35-36页 |
| 第3章 基于机器学习的数据预取引擎 | 第36-60页 |
| 3.1 背景 | 第36-37页 |
| 3.2 相关工作 | 第37-38页 |
| 3.3 预取结构 | 第38-42页 |
| 3.3.1 一级Cache多模式预取 | 第39-41页 |
| 3.3.2 二级Cache AMPM预取 | 第41-42页 |
| 3.4 基于机器学习算法的预取自调方法 | 第42-49页 |
| 3.4.1 特征提取及构建数据集 | 第43-45页 |
| 3.4.2 建立机器学习模型 | 第45-48页 |
| 3.4.3 动态自适应调整 | 第48-49页 |
| 3.5 实验方法及结果 | 第49-59页 |
| 3.5.1 实验环境 | 第49-51页 |
| 3.5.2 实验结果 | 第51-59页 |
| 3.6 本章小结 | 第59-60页 |
| 第4章 多核服务器系统中数据处理单元建模 | 第60-80页 |
| 4.1 背景 | 第60-61页 |
| 4.2 目标分析 | 第61-63页 |
| 4.3 相关工作 | 第63-65页 |
| 4.4 基于ARMv8指令集的4-SMT单核软件模拟器建模 | 第65-72页 |
| 4.4.1 系统整体框架 | 第65-66页 |
| 4.4.2 功能模型 | 第66-68页 |
| 4.4.3 性能模型 | 第68-72页 |
| 4.5 模拟器评测 | 第72-79页 |
| 4.5.1 实验方法 | 第72-73页 |
| 4.5.2 实验结果 | 第73-79页 |
| 4.6 本章小结 | 第79-80页 |
| 第5章 总结与展望 | 第80-81页 |
| 参考文献 | 第81-86页 |
| 作者攻读硕士学位期间参与科研工作的情况 | 第86页 |