摘要 | 第1-4页 |
Abstract | 第4-7页 |
1 引言 | 第7-8页 |
2 H.264 帧内压缩格式 | 第8-26页 |
·目前流行压缩格式比较 | 第8-20页 |
·JPEG 压缩原理 | 第8-10页 |
·JPEG2000 压缩原理 | 第10-14页 |
·H.264I 帧编码原理 | 第14-20页 |
·数据压缩 | 第14-17页 |
·抗误码抗丢包特性 | 第17-18页 |
·接收端De-block 滤波器 | 第18-20页 |
·JPEG、JPEG2000、H.264 Intra 编码器比较 | 第20-24页 |
·从编码器结构上比较 | 第20-21页 |
·从使用技术上比较 | 第21页 |
·从实测性能上比较 | 第21-24页 |
·比较结论 | 第24页 |
·H.264 Intra 开源编码器选择 | 第24-26页 |
3 TI TMS320DM6437 数字信号处理器 | 第26-44页 |
·TMS320DM6437 CPU 构成 | 第26-41页 |
·综述 | 第26-27页 |
·DSP CPU 核系统组成及基本功能 | 第27-28页 |
·运算单元、数据总线、寄存器堆间数据通路 | 第28-30页 |
·C64x+核硬件流水线 | 第30-32页 |
·指令与执行单元映射 | 第32-34页 |
·指令运行周期统计 | 第34页 |
·分级存储结构和 Cache 系统 | 第34-41页 |
·DSP 分级存储结构 | 第34-36页 |
·Cache 工作原理 | 第36-41页 |
·C64x+核上程序运行原理 | 第41-44页 |
·TI 编译器工作过程 | 第41-43页 |
·编译 | 第41-42页 |
·连接 | 第42页 |
·分段 | 第42页 |
·地址映射 | 第42-43页 |
·特殊存储器空间:堆(Heap)和栈(Stack) | 第43-44页 |
·堆 | 第43页 |
·栈 | 第43-44页 |
4 H.264 Intra mode 在DM6437 上的优化 | 第44-84页 |
·传统算法优化手段 | 第44-45页 |
·传统算法优化的依据 | 第44页 |
·传统算法优化基本工序 | 第44-45页 |
·传统算法优化的弊端 | 第45页 |
·本文提出的新算法优化思想 | 第45-67页 |
·算法总体优化思想---资源平衡 | 第45-49页 |
·通用DSP 优化手段 | 第49-67页 |
·运算需求与运算单元平衡 | 第49-52页 |
·针对指令集写程序 | 第52-54页 |
·尽量保持软件流水连续 | 第54-58页 |
·内部和外部数据总线读写速度平衡 | 第58-59页 |
·数据的输送节奏与程序运行需求协调 | 第59-60页 |
·Program cache/ram 配置大小与代码量平衡 | 第60-61页 |
·Data cache/ram 配置大小与常用数据块大小和数量相平衡 | 第61页 |
·数据使用频繁程度与存放位置相对应 | 第61页 |
·使用 Profile 工具 | 第61-63页 |
·使代码风格与优化手段相对应 | 第63-64页 |
·线性汇编优化 | 第64-66页 |
·使用内联函数 | 第66-67页 |
·针对 H.264 I 帧编码的优化 | 第67-84页 |
·程序移植 | 第67-71页 |
·移植手段 | 第67-70页 |
·移植结果 | 第70-71页 |
·程序流程与内容分析 | 第71-74页 |
·针对性重点优化手段和策略 | 第74-84页 |
·重点优化循环 | 第74-80页 |
·优化数据存放 | 第80-84页 |
5 结果验证 | 第84-92页 |
·测试样本选择 | 第84-85页 |
·编码参数设置 | 第85-86页 |
·优化前后速度比较 | 第86-87页 |
·正确性验证 | 第87页 |
·QP 余量测试 | 第87-92页 |
6 结论 | 第92-93页 |
参考文献 | 第93-95页 |
发表文章目录 | 第95-96页 |
致谢 | 第96页 |