| 缩略语说明 | 第1-15页 |
| 摘要 | 第15-17页 |
| ABSTRACT | 第17-19页 |
| 第一章 绪论 | 第19-47页 |
| ·课题研究背景 | 第19-31页 |
| ·多核微处理器的发展现状 | 第19-22页 |
| ·DSP的发展现状 | 第22-26页 |
| ·多核DSP的应用特点 | 第26-29页 |
| ·多核DSP面临的数据存储问题 | 第29-31页 |
| ·本文的研究内容 | 第31-32页 |
| ·相关研究工作 | 第32-43页 |
| ·减少多处理器远程访问延迟的相关工作 | 第32-35页 |
| ·多处理器数据前瞻相关技术 | 第35-36页 |
| ·流存储技术的相关研究 | 第36-42页 |
| ·相关研究工作的不足 | 第42-43页 |
| ·本文的工作与创新点 | 第43-45页 |
| ·论文的组织结构 | 第45-47页 |
| 第二章 异构多核DSP系统平台:SDSP与PolyDSP | 第47-70页 |
| ·异构多核DSP超节点:SDSP | 第47-60页 |
| ·SDSP总体结构 | 第47-49页 |
| ·处理器核之间的同步与通信 | 第49-53页 |
| ·SDSP的存储层次 | 第53-56页 |
| ·SDSP的片上网络接口 | 第56-58页 |
| ·SDSP的软件模拟器:SDSP-Sim | 第58-60页 |
| ·基于超节点扩展的大规模异构多核DSP系统:PolyDSP | 第60-63页 |
| ·超节点互连拓扑结构 | 第60-61页 |
| ·超节点间的同步与通信 | 第61-63页 |
| ·面向PolyDSP的并行编程 | 第63-69页 |
| ·程序的抽象层次与执行环境 | 第63-66页 |
| ·程序的并行化映射方法与编译 | 第66-69页 |
| ·本章小结 | 第69-70页 |
| 第三章 异构多核DSP应用的数据流特征分析 | 第70-80页 |
| ·测试程序的选择与并行化映射 | 第70-71页 |
| ·数据流的分布统计与特征分析 | 第71-79页 |
| ·关于数据流的若干定义 | 第71-72页 |
| ·单核DSP结构下数据流的分布特征 | 第72-75页 |
| ·多核DSP共享存储结构下数据流的分布特征 | 第75-79页 |
| ·本章小结 | 第79-80页 |
| 第四章 DSCF:面向共享存储多核DSP的数据流分簇前向技术 | 第80-97页 |
| ·引言 | 第80-81页 |
| ·数据流分簇前向技术DSCF | 第81-90页 |
| ·DSCF的硬件组成结构 | 第81-84页 |
| ·DSCF专用指令、原语与握手信号 | 第84-87页 |
| ·DSCF的通信协议 | 第87-90页 |
| ·DSCF的性能评测 | 第90-96页 |
| ·设计参数的分析 | 第90-91页 |
| ·性能对比实验 | 第91-96页 |
| ·本章小结 | 第96-97页 |
| 第五章 一种面向多核DSP的快速共享便笺存储技术 | 第97-113页 |
| ·引言 | 第97-98页 |
| ·FCC-SDP的组成结构与关键技术 | 第98-104页 |
| ·带旁路的读写队列与解耦的存控逻辑 | 第98-100页 |
| ·模式操作与双体交叉访问 | 第100-101页 |
| ·基于信号灯的快速同步机制 | 第101-102页 |
| ·软件延迟槽 | 第102-103页 |
| ·利用FCC-SDP的数据流水传输 | 第103-104页 |
| ·FCC-SDP的设计优化 | 第104-107页 |
| ·消除读访问冲突 | 第104-106页 |
| ·最佳单体存储容量的选择 | 第106-107页 |
| ·FCC-SDP在SDSP中的设计实现与性能评测 | 第107-112页 |
| ·性能对比实验 | 第108-111页 |
| ·扩展性实验与分析 | 第111-112页 |
| ·本章小结 | 第112-113页 |
| 第六章 DSTCE:一种支持数据前瞻的数据流传输控制引擎设计与分析 | 第113-129页 |
| ·引言 | 第113页 |
| ·DSTCE的结构设计与工作机制 | 第113-121页 |
| ·DSTCE的结构与设计 | 第113-119页 |
| ·DSTCE的数据流传输过程 | 第119页 |
| ·DSTCE对PolyDSP系统并行编程的支持 | 第119-121页 |
| ·基于DSTCE的数据流前瞻传输机制 | 第121-124页 |
| ·性能与扩展性对比实验 | 第124-128页 |
| ·DSTCE对SDSP性能影响的评测 | 第124-125页 |
| ·与基于CC-NUMA结构的扩展性对比实验 | 第125-128页 |
| ·本章小结 | 第128-129页 |
| 第七章 基于链表式数据流预取技术的外存控制接口设计与访存带宽优化 | 第129-155页 |
| ·引言 | 第129-130页 |
| ·EMCI的结构与关键设计技术 | 第130-139页 |
| ·EMCI总体结构与访存协议 | 第130-134页 |
| ·EMCI的关键设计技术 | 第134-139页 |
| ·基于数据流预取的EMCI访存带宽优化 | 第139-146页 |
| ·数据流预取的可行性分析 | 第139-140页 |
| ·基于链表式双预取缓冲的数据流预取技术 | 第140-146页 |
| ·EMCI的性能评测 | 第146-155页 |
| ·Burst流水对DSTCE访存性能的影响 | 第146-147页 |
| ·L2子块优先访问技术对计算性能的影响 | 第147-148页 |
| ·数据流预取技术的性能评测 | 第148-155页 |
| 第八章 结束语 | 第155-158页 |
| ·本文所做的工作 | 第155-157页 |
| ·进一步的研究工作 | 第157-158页 |
| 致谢 | 第158-159页 |
| 参考文献 | 第159-169页 |
| 作者在学期间取得的学术成果 | 第169-172页 |
| 附录A 数据流分析器(DSA)识别数据流的伪语言算法 | 第172-174页 |
| 附录B 三个典型程序在SDSP上的并行化映射 | 第174-178页 |
| 附录C EMCI的数据流预测与预取算法流程 | 第178页 |