基于TI DM6437的H.264 I帧编码器算法优化

摘要	第1-4页
Abstract	第4-7页
1 引言	第7-8页
2 H.264 帧内压缩格式	第8-26页
·目前流行压缩格式比较	第8-20页
·JPEG 压缩原理	第8-10页
·JPEG2000 压缩原理	第10-14页
·H.264I 帧编码原理	第14-20页
·数据压缩	第14-17页
·抗误码抗丢包特性	第17-18页
·接收端De-block 滤波器	第18-20页
·JPEG、JPEG2000、H.264 Intra 编码器比较	第20-24页
·从编码器结构上比较	第20-21页
·从使用技术上比较	第21页
·从实测性能上比较	第21-24页
·比较结论	第24页
·H.264 Intra 开源编码器选择	第24-26页
3 TI TMS320DM6437 数字信号处理器	第26-44页
·TMS320DM6437 CPU 构成	第26-41页
·综述	第26-27页
·DSP CPU 核系统组成及基本功能	第27-28页
·运算单元、数据总线、寄存器堆间数据通路	第28-30页
·C64x+核硬件流水线	第30-32页
·指令与执行单元映射	第32-34页
·指令运行周期统计	第34页
·分级存储结构和 Cache 系统	第34-41页
·DSP 分级存储结构	第34-36页
·Cache 工作原理	第36-41页
·C64x+核上程序运行原理	第41-44页
·TI 编译器工作过程	第41-43页
·编译	第41-42页
·连接	第42页
·分段	第42页
·地址映射	第42-43页
·特殊存储器空间：堆（Heap）和栈（Stack）	第43-44页
·堆	第43页
·栈	第43-44页
4 H.264 Intra mode 在DM6437 上的优化	第44-84页
·传统算法优化手段	第44-45页
·传统算法优化的依据	第44页
·传统算法优化基本工序	第44-45页
·传统算法优化的弊端	第45页
·本文提出的新算法优化思想	第45-67页
·算法总体优化思想---资源平衡	第45-49页
·通用DSP 优化手段	第49-67页
·运算需求与运算单元平衡	第49-52页
·针对指令集写程序	第52-54页
·尽量保持软件流水连续	第54-58页
·内部和外部数据总线读写速度平衡	第58-59页
·数据的输送节奏与程序运行需求协调	第59-60页
·Program cache/ram 配置大小与代码量平衡	第60-61页
·Data cache/ram 配置大小与常用数据块大小和数量相平衡	第61页
·数据使用频繁程度与存放位置相对应	第61页
·使用 Profile 工具	第61-63页
·使代码风格与优化手段相对应	第63-64页
·线性汇编优化	第64-66页
·使用内联函数	第66-67页
·针对 H.264 I 帧编码的优化	第67-84页
·程序移植	第67-71页
·移植手段	第67-70页
·移植结果	第70-71页
·程序流程与内容分析	第71-74页
·针对性重点优化手段和策略	第74-84页
·重点优化循环	第74-80页
·优化数据存放	第80-84页
5 结果验证	第84-92页
·测试样本选择	第84-85页
·编码参数设置	第85-86页
·优化前后速度比较	第86-87页
·正确性验证	第87页
·QP 余量测试	第87-92页
6 结论	第92-93页
参考文献	第93-95页
发表文章目录	第95-96页
致谢	第96页