摘要 | 第5-7页 |
ABSTRACT | 第7-8页 |
第一章 引言 | 第15-23页 |
1.1 图形处理器(GPU) | 第15-16页 |
1.2 基于GPU的通用计算 | 第16-17页 |
1.3 网络领域中的GPU并行算法研究 | 第17-19页 |
1.4 本文贡献 | 第19-20页 |
1.5 论文结构 | 第20-23页 |
第二章 现代GPU架构 | 第23-31页 |
2.1 GPU vs CPU | 第23-24页 |
2.2 CUDA | 第24-27页 |
2.2.1 平台模型 | 第25页 |
2.2.2 内存模型 | 第25-26页 |
2.2.3 执行模型 | 第26页 |
2.2.4 编程模型 | 第26-27页 |
2.3 GPU架构演进 | 第27-28页 |
2.4 前景展望 | 第28-31页 |
第三章 基于图形处理器的高速NFA匹配算法的研究 | 第31-57页 |
3.1 正则表达式匹配 | 第31-33页 |
3.2 正则表达式匹配的研究现状 | 第33-40页 |
3.2.1 基于FPGA的NFA实现 | 第34-37页 |
3.2.2 基于TCAM的NFA实现 | 第37-39页 |
3.2.3 基于GPU的NFA实现 | 第39-40页 |
3.3 基础设计 | 第40-47页 |
3.3.1 NFA状态间的兼容性 | 第43-44页 |
3.3.2 兼容组 | 第44-46页 |
3.3.3 匹配操作 | 第46-47页 |
3.3.4 相关讨论 | 第47页 |
3.4 实现细节及优化 | 第47-51页 |
3.4.1 NFA状态转换表 | 第47-48页 |
3.4.2 活跃状态数组 | 第48页 |
3.4.3 输入字符处理 | 第48-49页 |
3.4.4 数据包的存储布局 | 第49-51页 |
3.4.5 相关讨论 | 第51页 |
3.5 虚拟NFA(Virtual NFA)设计 | 第51-54页 |
3.5.1 虚拟状态 | 第51-52页 |
3.5.2 划分兼容超级组 | 第52-53页 |
3.5.3 操作调整 | 第53-54页 |
3.6 实验评估 | 第54-56页 |
3.6.1 实验设置 | 第54-55页 |
3.6.2 匹配速度 | 第55页 |
3.6.3 存储规模 | 第55-56页 |
3.7 结论 | 第56-57页 |
第四章 基于图形处理器并行化LZSS压缩算法的研究 | 第57-77页 |
4.1 数据压缩 | 第57-58页 |
4.2 LZ77算法族 | 第58-62页 |
4.2.1 LZ77 | 第58-59页 |
4.2.2 LZSS | 第59-60页 |
4.2.3 基于后缀数组的方法 | 第60-62页 |
4.3 LZ77族算法的并行化 | 第62-64页 |
4.3.1 在多核CPU上并行化压缩算法 | 第62页 |
4.3.2 在众核GPU上并行化压缩算法 | 第62-64页 |
4.4 CULZSS的问题分析 | 第64页 |
4.5 GLZSS-basic的设计 | 第64-67页 |
4.6 GLZSS-tagging的设计 | 第67-69页 |
4.7 实验评估 | 第69-75页 |
4.7.1 实验设置 | 第70页 |
4.7.2 压缩速度评估 | 第70-71页 |
4.7.3 压缩率评估 | 第71-72页 |
4.7.4 哈希表规模的选择 | 第72-73页 |
4.7.5 解压缩 | 第73-75页 |
4.8 结论 | 第75-77页 |
第五章 基于图形处理器并行化Deflate压缩算法的研究 | 第77-97页 |
5.1 Deflate压缩算法 | 第77-81页 |
5.1.1 哈夫曼编码 | 第77-78页 |
5.1.2 Deflate压缩算法 | 第78-81页 |
5.2 已有工作 | 第81-84页 |
5.3 在GPU上并行化哈夫曼编码算法 | 第84-93页 |
5.3.1 字符频率统计 | 第84-88页 |
5.3.2 构建哈夫曼树 | 第88-89页 |
5.3.3 编码 | 第89-93页 |
5.4 性能评估 | 第93-96页 |
5.4.1 基于GPU的哈夫曼编码算法压缩速率 | 第93-94页 |
5.4.2 基于GPU的Deflate算法压缩速率 | 第94页 |
5.4.3 压缩率 | 第94-96页 |
5.5 结论 | 第96-97页 |
第六章 总结与展望 | 第97-99页 |
参考文献 | 第99-109页 |
致谢 | 第109-111页 |
在读期间发表的学术论文 | 第111页 |