| 摘要 | 第1-4页 |
| Abstract | 第4-7页 |
| 1 引言 | 第7-8页 |
| 2 H.264 帧内压缩格式 | 第8-26页 |
| ·目前流行压缩格式比较 | 第8-20页 |
| ·JPEG 压缩原理 | 第8-10页 |
| ·JPEG2000 压缩原理 | 第10-14页 |
| ·H.264I 帧编码原理 | 第14-20页 |
| ·数据压缩 | 第14-17页 |
| ·抗误码抗丢包特性 | 第17-18页 |
| ·接收端De-block 滤波器 | 第18-20页 |
| ·JPEG、JPEG2000、H.264 Intra 编码器比较 | 第20-24页 |
| ·从编码器结构上比较 | 第20-21页 |
| ·从使用技术上比较 | 第21页 |
| ·从实测性能上比较 | 第21-24页 |
| ·比较结论 | 第24页 |
| ·H.264 Intra 开源编码器选择 | 第24-26页 |
| 3 TI TMS320DM6437 数字信号处理器 | 第26-44页 |
| ·TMS320DM6437 CPU 构成 | 第26-41页 |
| ·综述 | 第26-27页 |
| ·DSP CPU 核系统组成及基本功能 | 第27-28页 |
| ·运算单元、数据总线、寄存器堆间数据通路 | 第28-30页 |
| ·C64x+核硬件流水线 | 第30-32页 |
| ·指令与执行单元映射 | 第32-34页 |
| ·指令运行周期统计 | 第34页 |
| ·分级存储结构和 Cache 系统 | 第34-41页 |
| ·DSP 分级存储结构 | 第34-36页 |
| ·Cache 工作原理 | 第36-41页 |
| ·C64x+核上程序运行原理 | 第41-44页 |
| ·TI 编译器工作过程 | 第41-43页 |
| ·编译 | 第41-42页 |
| ·连接 | 第42页 |
| ·分段 | 第42页 |
| ·地址映射 | 第42-43页 |
| ·特殊存储器空间:堆(Heap)和栈(Stack) | 第43-44页 |
| ·堆 | 第43页 |
| ·栈 | 第43-44页 |
| 4 H.264 Intra mode 在DM6437 上的优化 | 第44-84页 |
| ·传统算法优化手段 | 第44-45页 |
| ·传统算法优化的依据 | 第44页 |
| ·传统算法优化基本工序 | 第44-45页 |
| ·传统算法优化的弊端 | 第45页 |
| ·本文提出的新算法优化思想 | 第45-67页 |
| ·算法总体优化思想---资源平衡 | 第45-49页 |
| ·通用DSP 优化手段 | 第49-67页 |
| ·运算需求与运算单元平衡 | 第49-52页 |
| ·针对指令集写程序 | 第52-54页 |
| ·尽量保持软件流水连续 | 第54-58页 |
| ·内部和外部数据总线读写速度平衡 | 第58-59页 |
| ·数据的输送节奏与程序运行需求协调 | 第59-60页 |
| ·Program cache/ram 配置大小与代码量平衡 | 第60-61页 |
| ·Data cache/ram 配置大小与常用数据块大小和数量相平衡 | 第61页 |
| ·数据使用频繁程度与存放位置相对应 | 第61页 |
| ·使用 Profile 工具 | 第61-63页 |
| ·使代码风格与优化手段相对应 | 第63-64页 |
| ·线性汇编优化 | 第64-66页 |
| ·使用内联函数 | 第66-67页 |
| ·针对 H.264 I 帧编码的优化 | 第67-84页 |
| ·程序移植 | 第67-71页 |
| ·移植手段 | 第67-70页 |
| ·移植结果 | 第70-71页 |
| ·程序流程与内容分析 | 第71-74页 |
| ·针对性重点优化手段和策略 | 第74-84页 |
| ·重点优化循环 | 第74-80页 |
| ·优化数据存放 | 第80-84页 |
| 5 结果验证 | 第84-92页 |
| ·测试样本选择 | 第84-85页 |
| ·编码参数设置 | 第85-86页 |
| ·优化前后速度比较 | 第86-87页 |
| ·正确性验证 | 第87页 |
| ·QP 余量测试 | 第87-92页 |
| 6 结论 | 第92-93页 |
| 参考文献 | 第93-95页 |
| 发表文章目录 | 第95-96页 |
| 致谢 | 第96页 |