嵌入式环境下三线性分解算法优化技术研究

摘要	第1-6页
Abstract	第6-11页
插图索引	第11-13页
附表索引	第13-14页
第1章绪论	第14-18页
·论文研究背景	第14-15页
·选题背景	第14页
·研究意义	第14-15页
·矩阵乘法优化技术现状	第15-16页
·主要工作及章节安排	第16-17页
·小结	第17-18页
第2章三线性分解算法及通用和嵌入式优化技术	第18-30页
·引言	第18页
·三维荧光分析中的三线性分解方法	第18-20页
·三线性模型	第18-19页
·平行因子算法	第19页
·交替三线性分解算法	第19-20页
·通用代码优化技术	第20-24页
·减少数据相关	第20-22页
·隐藏慢操作时间	第22-23页
·编译器自动优化	第23-24页
·协处理器优化技术	第24-28页
·Cell B.E.架构	第24-25页
·CUDA架构	第25-27页
·FPGA加速器	第27-28页
·嵌入式优化技术	第28-29页
·存储层次优化	第28页
·异构多核架构优化	第28-29页
·小结	第29-30页
第3章三线性分解算法分析及优化方案研究	第30-38页
·引言	第30页
·三线性分解算法性能分析	第30-35页
·MATLAB代码分析	第30-32页
·RealView仿真分析	第32-34页
·实际平台分析	第34-35页
·优化方案的确定	第35-36页
·加速比分析	第36-37页
·小结	第37-38页
第4章针对ARMv7中ARM核心的矩阵乘法优化	第38-43页
·引言	第38页
·原始分块算法分析	第38-40页
·针对ARM核心的矩阵乘法优化	第40-42页
·指令的执行顺序	第41页
·TLB的替换策略	第41-42页
·小结	第42-43页
第5章针对ARMv7中NEON核心的矩阵乘法优化	第43-54页
·引言	第43页
·NEON核心分析	第43-44页
·数据处理优化	第44-50页
·矩阵乘法核函数	第44-45页
·矩阵元素的计算顺序	第45-46页
·指令调度优化	第46-50页
·数据访存优化	第50-53页
·利用NEON的访存指令	第50-52页
·数据预取	第52-53页
·小结	第53-54页
第6章优化效果评估	第54-63页
·实验平台及方案介绍	第54-55页
·矩阵乘法优化效果及评价	第55-61页
·Cortex-A8处理器平台	第56-58页
·Cortex-A9处理器平台	第58-59页
·Scorpion处理器平台	第59-61页
·矩阵乘法优化效果评价	第61页
·整体优化效果及评价	第61-62页
·小结	第62-63页
结论	第63-66页
参考文献	第66-69页
附录A 攻读学位期间发表的学术论文目录	第69-70页
附录B 攻读学位期间所参加的科研项目及竞赛目录	第70-71页
致谢	第71页