摘要 | 第1-5页 |
ABSTRACT | 第5-10页 |
第一章 绪论 | 第10-17页 |
·课题背景和研究意义 | 第10-11页 |
·国内外研究现状 | 第11-16页 |
·语音编解码技术的发展 | 第11-13页 |
·GPGPU 技术的发展 | 第13-16页 |
·论文主要工作及章节安排 | 第16-17页 |
第二章 通用加速计算与SILK 编解码器原理 | 第17-48页 |
·GPU 并行计算 | 第17-20页 |
·并行计算概述 | 第17-18页 |
·GPGPU 计算 | 第18-20页 |
·着色程序 | 第18页 |
·与着色无关的可扩展性编程 | 第18-20页 |
·OpenCL | 第20-28页 |
·OpenCL 标准 | 第21页 |
·嵌入式设备上的OpenCL | 第21-23页 |
·OpenCL 语言模型 | 第23-28页 |
·平台模型 | 第23-24页 |
·执行模型 | 第24-26页 |
·内存模型 | 第26-28页 |
·OpenCL 编程步骤 | 第28-29页 |
·负载平衡 | 第29-33页 |
·负载平衡的历史 | 第30页 |
·传统的负载平衡技术 | 第30-31页 |
·GPU 上的负载平衡 | 第31-32页 |
·自动可调的GPU 算法 | 第32-33页 |
·SILK 编解码器 | 第33-47页 |
·SILK 编解码器的控制参数 | 第33-34页 |
·SILK 编码器 | 第34-45页 |
·SILK 解码器 | 第45-47页 |
·本章小结 | 第47-48页 |
第三章 基于OpenCL 的SILK 编码器中LPC 处理的实现 | 第48-79页 |
·LPC 处理的OpenCL 版本 | 第48-55页 |
·实现框架 | 第48-49页 |
·测试框架 | 第49页 |
·实现流程 | 第49-55页 |
·基于OpenCL 的LPC 处理的优化 | 第55-74页 |
·帧的并行化 | 第55-57页 |
·独立计算部分 | 第57页 |
·增加计算负载 | 第57-59页 |
·增加输入帧的长度 | 第58-59页 |
·并行处理多个文件块 | 第59页 |
·协处理功能实现 | 第59-63页 |
·CPU 上的OpenCL | 第60页 |
·LPC 处理的OpenCL 版本的协处理实现 | 第60-63页 |
·任务并行 | 第63-64页 |
·内核函数的优化 | 第64-69页 |
·数据传输优化 | 第64-65页 |
·内存访问优化 | 第65-67页 |
·控制流优化 | 第67-69页 |
·使用OpenCL 的内建数学函数 | 第69页 |
·OpenCL 内核函数矩阵运算的优化过程 | 第69-74页 |
·OpenCL 版本的内核函数功能 | 第74-78页 |
·本章小结 | 第78-79页 |
第四章 性能测试与评估 | 第79-86页 |
·测试平台与开发环境 | 第79-80页 |
·GPGPU 平台时延 | 第80-81页 |
·测试数据 | 第81-84页 |
·结果总结 | 第84-85页 |
·本章小结 | 第85-86页 |
第五章 总结与展望 | 第86-90页 |
·总结 | 第86-87页 |
·展望 | 第87-88页 |
·进一步优化OpenCL 的执行方案 | 第87-88页 |
·大规模并行音频处理 | 第88页 |
·使代码能够更好地集成于库中 | 第88页 |
·将SILK 其他部分的代码用OpenCL 实现 | 第88页 |
·在嵌入式设备上运行 | 第88页 |
·结束语 | 第88-90页 |
致谢 | 第90-91页 |
参考文献 | 第91-94页 |