首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--一般性问题论文--设计与性能分析论文

基于龙芯平台的虚拟机研究

摘要第5-6页
ABSTRACT第6页
第1章 绪论第18-28页
    1.1 研究背景第18-24页
        1.1.1 国产处理器基本情况第18-19页
        1.1.2 二进制翻译第19-21页
        1.1.3 虚拟机第21-22页
        1.1.4 多核处理器第22-23页
        1.1.5 内核态虚拟化技术第23-24页
    1.2 本文的研究内容和组织第24-27页
        1.2.1 虚拟机设计和优化目前存在的问题第24-25页
        1.2.2 本文的研究内容和主要贡献第25页
        1.2.3 本文的组织结构第25-27页
    1.3 本章小结第27-28页
第2章 本文相关研究工作第28-52页
    2.1 相关研究概述第28-31页
        2.1.1 二进制翻译第28-30页
        2.1.2 虚拟机第30-31页
    2.2 二进制翻译相关工作第31-41页
        2.2.1 FX!32:基于度量的离线优化第32-33页
        2.2.2 UQBT和UQDBT:二进制翻译器的编译器视角第33-34页
        2.2.3 DAISY和BOA:VLIW指令集上的协同设计第34-35页
        2.2.4 Crusoe处理器和CMS:协同设计处理器及配套软件第35-36页
        2.2.5 Dynamo:用于优化的二进制翻译器第36-37页
        2.2.6 IA-32EL:Intel官方模拟X86的二进制翻译器第37-39页
        2.2.7 QEMU:设计精巧的开源二进制翻译器第39-41页
    2.3 虚拟处理器实现第41-46页
        2.3.1 虚拟处理器实现概述第41-42页
        2.3.2 “陷阱-模拟”方法解决同指令集虚拟化第42-43页
        2.3.3 “扫描-修补”方法解决同指令集虚拟化第43-44页
        2.3.4 “特权解除”方法解决同指令集虚拟化第44-45页
        2.3.5 硬件虚拟化解决同指令集虚拟化第45页
        2.3.6 二进制翻译解决指令集虚拟化第45-46页
    2.4 二进制翻译技术基础第46-50页
        2.4.1 二进制翻译概述第46-48页
        2.4.2 解码基本技术第48-49页
        2.4.3 中间代码转成后端代码技术第49-50页
        2.4.4 后端代码的执行技术第50页
    2.5 本章小结第50-52页
第3章 虚拟处理器的优化第52-102页
    3.1 系统虚拟机的四元组表示和优化方法第52-55页
        3.1.1 系统虚拟机四元组表示概述第52-53页
        3.1.2 基于离线数据流分析的优化方法第53-55页
    3.2 二进制翻译实现和优化思路第55-57页
    3.3 虚拟处理器性能提升概论第57-58页
    3.4 T-Cache查找优化第58-64页
        3.4.1 T-Cache基础第58-59页
        3.4.2 基于数组查找的SEARCH-TABLE算法第59-60页
        3.4.3 基于循环查找的SEARCH-TABLE算法第60页
        3.4.4 基于散列查找的SEARCH-TABLE算法第60-62页
        3.4.5 散列函数的设计第62-63页
        3.4.6 查找算法对比第63页
        3.4.7 逆查找表的设计第63-64页
    3.5 T-Cache替换策略第64-73页
        3.5.1 T-Cache替换策略概论第64-66页
        3.5.2 T-Cache的性能量化第66-67页
        3.5.3 LRU替换策略第67页
        3.5.4 满时清空的替换策略第67-68页
        3.5.5 抢先清除的替换策略第68页
        3.5.6 FIFO替换策略第68-69页
        3.5.7 分空间FIFO替换策略第69页
        3.5.8 基于执行频率(LFE)的替换策略第69页
        3.5.9 基于综合优先级的替换策略第69-70页
        3.5.10 分阶段FIFO和LFE替换策略第70页
        3.5.11 替换策略的对比第70-71页
        3.5.12 T-Cache替换策略的局限性第71-73页
    3.6 间接跳转优化第73-82页
        3.6.1 间接跳转优化概论第73-74页
        3.6.2 基于内联缓存的间接跳转优化第74-75页
        3.6.3 基于跳转预测表的间接跳转优化第75-78页
        3.6.4 内联缓存的大小和替换算法第78-80页
        3.6.5 基于影子栈的跳转优化第80-82页
        3.6.6 间接跳转优化的算法性能评价第82页
    3.7 基于内存布局的性能优化小结第82页
    3.8 基本块优化第82-89页
        3.8.1 基本块优化概论第82-83页
        3.8.2 基于数据流分析的优化第83-86页
        3.8.3 窥孔优化第86-87页
        3.8.4 数学化简和强度削弱第87-88页
        3.8.5 基本块优化需要注意的事项第88-89页
        3.8.6 基本块优化算法性能评价第89页
    3.9 寄存器映射和翻译规则优化第89-93页
        3.9.1 寄存器映射第89-91页
        3.9.2 寄存器映射的细节探讨第91-92页
        3.9.3 寄存器映射和翻译规则优化的性能评价第92-93页
    3.10 超块优化第93-100页
        3.10.1 超块概述第93-95页
        3.10.2 超块的意义第95-97页
        3.10.3 超块实现算法第97-99页
        3.10.4 超块优化算法性能评价第99-100页
    3.11 基于虚拟指令系统的性能优化小结第100页
    3.12 本章小结第100-102页
第4章 跨ISA多核虚拟处理器实现第102-138页
    4.1 多核虚拟处理器概论第102-103页
    4.2 多核虚拟处理器的核心问题第103-111页
        4.2.1 概述第103-104页
        4.2.2 虚拟多核处理器中的Cache问题第104-106页
        4.2.3 虚拟多核处理器中的存储一致性模型第106-108页
        4.2.4 虚拟多核处理器中的串行化指令第108-109页
        4.2.5 虚拟多核处理器中的原子操作问题第109-110页
        4.2.6 虚拟多核处理器中的中断问题第110-111页
    4.3 函数级和指令级的原子操作解决方案第111-120页
        4.3.1 保证基本读写操作的原子性第111-112页
        4.3.2 保证LOCK类原子指令的原子性第112-113页
        4.3.3 CAS系列算法第113-115页
        4.3.4 基于GCC内建函数解决原子指令模拟第115-116页
        4.3.5 基于LL/SC指令的指令级解决原子指令模拟第116-118页
        4.3.6 保证非对齐访问的原子性第118-120页
    4.4 基于无锁队列和信号的中断解决方案第120-128页
        4.4.1 中断模拟概论第120-121页
        4.4.2 自学习实时信号解决中断发送问题第121-123页
        4.4.3 无锁队列解决中断接收问题概论第123-124页
        4.4.4 基于CAS类算法的无锁队列第124-126页
        4.4.5 基于安全读的无锁队列第126-128页
    4.5 实验和分析第128-137页
        4.5.1 实验平台介绍第128-129页
        4.5.2 测试程序简介第129页
        4.5.3 使用GCC内建函数实现原子指令第129-130页
        4.5.4 使用GCC内建函数实现安全读无锁队列第130-131页
        4.5.5 使用LL/SC实现原子指令第131-132页
        4.5.6 使用LL/SC实现安全读无锁队列第132页
        4.5.7 多线程pi实验结果对比研究第132-135页
        4.5.8 7-ZIP压缩解压缩实验结果对比研究第135-137页
    4.6 本章小结第137-138页
第5章 跨ISA内核化虚拟层实现和优化第138-156页
    5.1 跨ISA内核化虚拟层概论第138-139页
    5.2 跨ISA内核化虚拟层架构第139-149页
        5.2.1 架构概述第139-141页
        5.2.2 内核层第141页
        5.2.3 转发层概述第141页
        5.2.4 转发层:浮点转换库第141-144页
        5.2.5 转发层:C接口适配库第144-145页
        5.2.6 转发层:驱动转发库第145页
        5.2.7 虚拟层概述第145-146页
        5.2.8 虚拟层:虚拟处理器和虚拟设备第146-147页
        5.2.9 虚拟层:vMMU和vMEM的实现第147-148页
        5.2.10 客户层第148-149页
        5.2.11 调试库第149页
    5.3 实验和分析第149-154页
        5.3.1 nbench测试第150-152页
        5.3.2 基于HDPARM的测试第152-153页
        5.3.3 对于VGA性能的测试第153-154页
    5.4 本章小结第154-156页
第6章 总结与展望第156-158页
    6.1 本文研究工作总结第156页
    6.2 本文主要贡献和创新点第156-157页
    6.3 进一步工作第157页
    6.4 本章小结第157-158页
参考文献第158-168页
致谢第168-170页
攻读学位期间参加的科研项目第170页

论文共170页,点击 下载论文
上一篇:基于铁电薄膜的光解水光阴极制备与特性研究
下一篇:基于代数结构的交织器与卷积码的盲识别研究