基于Tegra X1处理器的4K内窥镜图像处理算法研发
致谢 | 第4-5页 |
摘要 | 第5-6页 |
ABSTRACT | 第6-7页 |
1 绪论 | 第11-21页 |
1.1 课题背景与意义 | 第11页 |
1.2 相关技术背景 | 第11-18页 |
1.2.1 GPGPU技术研究现状 | 第11-13页 |
1.2.2 图像前端处理 | 第13-15页 |
1.2.3 视频编码基本原理及标准 | 第15-18页 |
1.3 本文研究内容 | 第18-19页 |
1.4 本文组织结构 | 第19-21页 |
2 开发测试环境 | 第21-28页 |
2.1 CUDA简介 | 第21-24页 |
2.1.1 GPU硬件架构 | 第21-22页 |
2.1.2 CUDA编程模型 | 第22-24页 |
2.2 TegraX1介绍 | 第24-26页 |
2.2.1 Maxwell架构 | 第24-25页 |
2.2.2 Tegra X1硬件性能 | 第25-26页 |
2.3 系统硬件结构 | 第26-27页 |
2.4 本章小结 | 第27-28页 |
3 图像前端处理算法研发 | 第28-47页 |
3.1 并行方案设计 | 第28-29页 |
3.2 各模块原理及并行实现 | 第29-38页 |
3.2.1 黑电平校正与滤波 | 第29-30页 |
3.2.2 自动曝光,自动白平衡与伽玛校正 | 第30-34页 |
3.2.3 彩色滤波阵列插值与色彩空间转换 | 第34-37页 |
3.2.4 边缘增强 | 第37-38页 |
3.3 算法性能优化 | 第38-42页 |
3.3.1 共享内存 | 第38-39页 |
3.3.2 减少条件分支 | 第39-40页 |
3.3.3 零拷贝 | 第40-42页 |
3.4 双核任务分配 | 第42-43页 |
3.5 图像前端处理算法性能测试 | 第43-45页 |
3.5.1 测试方法 | 第43-44页 |
3.5.2 测试结果与分析 | 第44-45页 |
3.6 本章小结 | 第45-47页 |
4 H.264视频编码算法研发 | 第47-73页 |
4.1 编码系统设计 | 第47-49页 |
4.2 宏块级并行 | 第49-53页 |
4.2.1 帧内预测 | 第49-51页 |
4.2.2 P宏块的编码与重建 | 第51-52页 |
4.2.3 边界强度分析 | 第52-53页 |
4.3 像素级并行 | 第53-62页 |
4.3.1 帧间预测 | 第53-55页 |
4.3.2 I宏块与SKIP宏块的编码与重建 | 第55-60页 |
4.3.3 去块滤波 | 第60-62页 |
4.4 算法整体性能优化 | 第62-63页 |
4.5 H.264视频编码算法测试 | 第63-72页 |
4.5.1 H.264视频编码算法性能测试 | 第63-68页 |
4.5.2 H.264视频编码算法图像质量测试 | 第68-72页 |
4.6 本章小结 | 第72-73页 |
5 GPU任务调度与算法协同运行测试 | 第73-78页 |
5.1 GPU任务调度 | 第73-74页 |
5.2 流处理 | 第74-75页 |
5.3 算法协同运行测试 | 第75-77页 |
5.3.1 测试方法 | 第75页 |
5.3.2 测试结果与分析 | 第75-77页 |
5.4 本章小结 | 第77-78页 |
6 总结与展望 | 第78-80页 |
6.1 总结 | 第78页 |
6.2 展望 | 第78-80页 |
参考文献 | 第80-84页 |
作者简介 | 第84页 |