| 摘要 | 第1-6页 |
| Abstract | 第6-9页 |
| 第一章 绪论 | 第9-11页 |
| ·研究目的和意义 | 第9页 |
| ·论文研究内容和组织结构 | 第9-11页 |
| 第二章 相关工作 | 第11-19页 |
| ·GPU 架构简介 | 第11-12页 |
| ·CUDA 编程模型 | 第12-13页 |
| ·列数据库相关优化工作 | 第13-14页 |
| ·系统总体结构 | 第14-15页 |
| ·原语设计 | 第15-18页 |
| ·原语的输入和输出数据结构 | 第15-17页 |
| ·原语的功能描述 | 第17-18页 |
| ·本章小结 | 第18-19页 |
| 第三章 GPU 上列数据库原语的设计与优化 | 第19-43页 |
| ·GPU 程序优化方法 | 第19-20页 |
| ·基于 GPU 的连接原语设计与优化 | 第20-28页 |
| ·基于 Fermi 架构的 Hash Join | 第21-24页 |
| ·基于 Fermi 架构的 Sort-merge Join | 第24-26页 |
| ·基于 CUDA stream 的优化 | 第26-27页 |
| ·JOIN2 原语的优化 | 第27-28页 |
| ·基于 GPU 的分组和聚合原语设计与优化 | 第28-35页 |
| ·基于 GPU 的其他原语设计与优化 | 第35-42页 |
| ·条件判断原语优化 | 第35-38页 |
| ·字段选择原语优化 | 第38-40页 |
| ·排序原语优化 | 第40-41页 |
| ·向量算术和逻辑原语优化 | 第41-42页 |
| ·本章小结 | 第42-43页 |
| 第四章 GPU 显存管理 | 第43-49页 |
| ·GPU 显存管理的目标 | 第43页 |
| ·GPU 显存管理的实现方法 | 第43-48页 |
| ·显存块的数据结构 | 第43-45页 |
| ·分配算法和回收算法 | 第45-47页 |
| ·显存替换策略 | 第47-48页 |
| ·显存拷贝策略 | 第48页 |
| ·本章小结 | 第48-49页 |
| 第五章 实验测试与分析 | 第49-67页 |
| ·实验平台 | 第49-50页 |
| ·JOIN 原语性能分析 | 第50-61页 |
| ·JOIN 原语性能的影响因素 | 第50-56页 |
| ·CUDA stream 的效果 | 第56-57页 |
| ·GPU 与多核 CPU 的性能比较 | 第57-61页 |
| ·原语测试性能比较 | 第61-64页 |
| ·各 GPU 原语单独测试的性能比较 | 第61-62页 |
| ·各 GPU 原语在系统中的性能表现 | 第62-64页 |
| ·GPU 显存管理的效果 | 第64-66页 |
| ·本章小结 | 第66-67页 |
| 总结与展望 | 第67-68页 |
| 参考文献 | 第68-71页 |
| 攻读硕士学位期间取得的研究成果 | 第71-72页 |
| 致谢 | 第72-73页 |
| 附件 | 第73页 |