| 摘要 | 第1-9页 |
| ABSTRACT | 第9-10页 |
| 第一章 引言 | 第10-13页 |
| ·选题背景 | 第10-11页 |
| ·本文结构和内容安排 | 第11-13页 |
| 第二章 预备知识 | 第13-22页 |
| ·传统的矩阵存储计算方法 | 第13-19页 |
| ·CRS(Compressed Row Storage) | 第14页 |
| ·CCS(Compressed Column Storage): | 第14-15页 |
| ·FSBS(Fixed-Size Block Storage) | 第15-17页 |
| ·BCRS(Block Compressed Row Storage) | 第17-18页 |
| ·JDS(Jagged Diagonal Storage) | 第18-19页 |
| ·TJDS(Transposed Jagged Diagonal Storage) | 第19页 |
| ·哈夫曼编码理论的介绍 | 第19-22页 |
| 第三章 基于哈夫曼编码的矩阵的存储和计算 | 第22-30页 |
| ·显式填充零的BCRS方法 | 第22-24页 |
| ·数据结构 | 第22-23页 |
| ·示例数据表 | 第23页 |
| ·算法伪代码 | 第23页 |
| ·数据复杂度 | 第23-24页 |
| ·基于哈夫曼编码的BCRS方法 | 第24-27页 |
| ·具体方法描述 | 第24-25页 |
| ·数据结构 | 第25页 |
| ·实例 | 第25-26页 |
| ·数据复杂度 | 第26-27页 |
| ·理论分析与数据实验 | 第27-29页 |
| ·数据复杂度对比 | 第27页 |
| ·理论分析 | 第27页 |
| ·数据实验 | 第27-28页 |
| ·数据分析 | 第28-29页 |
| ·一般有限域上的情形 | 第29-30页 |
| 第四章 F4方法和矩阵的并行存储与计算 | 第30-42页 |
| ·F4算法与线性代数 | 第30-33页 |
| ·Gr?bner基算法的主要发展历程 | 第30-31页 |
| ·F4算法的线性性 | 第31页 |
| ·二元域上F4算法的线性化特点 | 第31-33页 |
| ·二元域上F4算法的矩阵存储与高斯消元的框架 | 第33-36页 |
| ·高斯消元法 | 第33-34页 |
| ·二元域上F4算法的矩阵分块 | 第34-36页 |
| ·二元域上大型矩阵存储与计算的传统方法 | 第36-38页 |
| ·0,1 矩阵压缩存储的基本模式 | 第36-37页 |
| ·基于格雷编码面向机器字的矩阵存储和计算 | 第37-38页 |
| ·基于CUDA的并行SMVP | 第38-42页 |
| ·CUDA简介 | 第38-39页 |
| ·CUDA编程模型 | 第39-41页 |
| ·基于CRS表示法和CUDA的稀疏矩阵乘法及其优化 | 第41-42页 |
| 第五章 总结和展望 | 第42-43页 |
| 致谢 | 第43-44页 |
| 参考文献 | 第44-47页 |
| 作者在学期间取得的学术成果 | 第47-48页 |
| 附录 | 第48-56页 |