嵌入式异构多核处理器设计与实现关键技术研究

摘要	第1-15页
ABSTRACT	第15-17页
第一章绪论	第17-35页
·研究背景	第17-21页
·微处理器的发展趋势	第17-18页
·应用需求对高性能嵌入式微处理器体系结构的挑战	第18-20页
·设计需求对高性能嵌入式微处理器设计方法的挑战	第20-21页
·相关研究	第21-30页
·典型异构多核处理器体系结构	第21-26页
·异构多核处理器研究现状	第26-28页
·面向特定应用定制处理器设计方法	第28-30页
·研究内容	第30-31页
·主要工作	第31-33页
·论文结构	第33-35页
第二章面向特定应用的嵌入式异构多核处理器体系结构	第35-51页
·总体结构	第35-39页
·CC 体系结构	第36-37页
·可扩展的DCC 体系结构	第37-39页
·DC 体系结构	第39-46页
·体系结构框架	第39-41页
·指令集格式	第41-42页
·流水线机制	第42-43页
·功能单元及其控制机制	第43-44页
·寄存器文件及其控制机制	第44-45页
·Socket 和互连总线	第45-46页
·DC 自动生成机制	第46-47页
·多核通信机制	第47-48页
·本章小结	第48-51页
第三章嵌入式异构多核处理器设计开发环境	第51-71页
·软硬件自动化设计开发环境	第51-52页
·体系结构描述文件	第52-53页
·可重定向编译器	第53-54页
·编译器前端	第53-54页
·编译器后端	第54页
·可重定向周期精确软件模拟器	第54-59页
·总体结构	第55-56页
·处理器模型的建立	第56-57页
·应用程序的预解释	第57页
·并发操作的模拟	第57-58页
·定制指令的加入	第58页
·模拟流程	第58-59页
·指令集定制方法	第59-63页
·问题描述	第59-60页
·多层次指令集定制算法	第60-62页
·算法性能分析	第62-63页
·DC 自动化生成工具	第63-66页
·自动化设计流程	第63-64页
·Map Genenrator 的设计	第64-65页
·Mach Generator 的设计	第65-66页
·软硬件协同验证与评测体系	第66-69页
·评测体系的建立	第66-67页
·单核的独立验证与评测	第67-68页
·多核的协同验证与评测	第68-69页
·本章小结	第69-71页
第四章多媒体应用程序特性与负载分析	第71-87页
·基准测试程序集	第71-72页
·测试环境和测试方法	第72-75页
·程序特性与工作负载分析	第75-83页
·操作类型及比例	第75-78页
·整数数据宽度	第78-79页
·Cache 需求分析	第79-81页
·程序指令并行度分析	第81-83页
·分析结果对体系结构设计的影响	第83-85页
·本章小结	第85-87页
第五章一种改进的DCT/IDCT 算法及功能单元体系结构	第87-105页
·DCT/IDCT 硬件实现方法概述	第87-88页
·DCT/IDCT 硬件实现算法	第88-92页
·DCT/IDCT 功能单元设计关键技术	第92-95页
·浮点程序到定点功能单元的映射	第92-93页
·动态伸缩技术	第93-95页
·误差控制机制	第95页
·DCT/IDCT 功能单元体系结构	第95-98页
·总体结构	第95-97页
·数据分块判决机制	第97-98页
·转置存储器	第98页
·实验结果与分析	第98-104页
·DCT/IDCT 变换精度分析	第99-102页
·DCT/IDCT 功能单元的性能与面积分析	第102-104页
·本章小结	第104-105页
第六章子字并行技术及功能单元体系结构	第105-121页
·引言	第105页
·子字并行指令	第105-108页
·子字并行指令类型	第105-106页
·子字并行指令特性	第106-108页
·子字并行指令需要的硬件支持	第108页
·具有子字并行功能的ALU 体系结构	第108-110页
·ALU 体系结构	第108-109页
·ALU 设计中的优化技术	第109-110页
·子字并行加法器体系结构	第110-112页
·多模式可配置子字并行乘法器体系结构	第112-117页
·子字并行乘法器设计目标	第112-113页
·16 位子字并行乘法器体系结构	第113-115页
·32 位混合子字并行乘法器体系结构	第115-117页
·乘累加运算的实现	第117页
·实验结果与分析	第117-119页
·程序性能分析	第117-118页
·硬件实现结果与分析	第118-119页
·本章小结	第119-121页
第七章基于CORDIC 算法的初等函数功能单元体系结构	第121-131页
·CORDIC 算法原理	第121-123页
·基于CORDIC 算法的初等函数快速统一实现	第123-126页
·迭代的实现方式	第123-124页
·迭代次数和迭代时间的减小	第124页
·扩大可收敛输入值范围	第124-125页
·其他设计考虑	第125-126页
·初等函数计算功能单元体系结构	第126-129页
·初等函数指令	第126-127页
·总体结构	第127-128页
·前处理模块	第128页
·CORDIC 计算核心	第128页
·后处理模块	第128-129页
·实验结果与分析	第129-130页
·性能分析	第129页
·硬件实现结果与分析	第129-130页
·本章小结	第130-131页
第八章 EHMP-01 处理器VLSI 实现及性能评测	第131-147页
·EHMP-01 总体结构	第131-132页
·LEON3 体系结构	第132-134页
·体系结构	第132-133页
·指令集结构	第133-134页
·Miracle 处理器核体系结构	第134-142页
·指令集结构	第134-136页
·数据通路	第136-137页
·功能单元	第137-139页
·寄存器文件	第139-140页
·混合存储子系统	第140-142页
·VLSI 实现结果	第142-143页
·前端流程	第142页
·后端流程	第142-143页
·测试和验证	第143页
·性能评测	第143-145页
·本章小结	第145-147页
结束语	第147-151页
致谢	第151-153页
参考文献	第153-165页
作者在学期间取得的学术成果	第165-166页