基于图形处理器的高速并行算法研究

摘要	第5-7页
ABSTRACT	第7-8页
第一章引言	第15-23页
1.1 图形处理器(GPU)	第15-16页
1.2 基于GPU的通用计算	第16-17页
1.3 网络领域中的GPU并行算法研究	第17-19页
1.4 本文贡献	第19-20页
1.5 论文结构	第20-23页
第二章现代GPU架构	第23-31页
2.1 GPU vs CPU	第23-24页
2.2 CUDA	第24-27页
2.2.1 平台模型	第25页
2.2.2 内存模型	第25-26页
2.2.3 执行模型	第26页
2.2.4 编程模型	第26-27页
2.3 GPU架构演进	第27-28页
2.4 前景展望	第28-31页
第三章基于图形处理器的高速NFA匹配算法的研究	第31-57页
3.1 正则表达式匹配	第31-33页
3.2 正则表达式匹配的研究现状	第33-40页
3.2.1 基于FPGA的NFA实现	第34-37页
3.2.2 基于TCAM的NFA实现	第37-39页
3.2.3 基于GPU的NFA实现	第39-40页
3.3 基础设计	第40-47页
3.3.1 NFA状态间的兼容性	第43-44页
3.3.2 兼容组	第44-46页
3.3.3 匹配操作	第46-47页
3.3.4 相关讨论	第47页
3.4 实现细节及优化	第47-51页
3.4.1 NFA状态转换表	第47-48页
3.4.2 活跃状态数组	第48页
3.4.3 输入字符处理	第48-49页
3.4.4 数据包的存储布局	第49-51页
3.4.5 相关讨论	第51页
3.5 虚拟NFA(Virtual NFA)设计	第51-54页
3.5.1 虚拟状态	第51-52页
3.5.2 划分兼容超级组	第52-53页
3.5.3 操作调整	第53-54页
3.6 实验评估	第54-56页
3.6.1 实验设置	第54-55页
3.6.2 匹配速度	第55页
3.6.3 存储规模	第55-56页
3.7 结论	第56-57页
第四章基于图形处理器并行化LZSS压缩算法的研究	第57-77页
4.1 数据压缩	第57-58页
4.2 LZ77算法族	第58-62页
4.2.1 LZ77	第58-59页
4.2.2 LZSS	第59-60页
4.2.3 基于后缀数组的方法	第60-62页
4.3 LZ77族算法的并行化	第62-64页
4.3.1 在多核CPU上并行化压缩算法	第62页
4.3.2 在众核GPU上并行化压缩算法	第62-64页
4.4 CULZSS的问题分析	第64页
4.5 GLZSS-basic的设计	第64-67页
4.6 GLZSS-tagging的设计	第67-69页
4.7 实验评估	第69-75页
4.7.1 实验设置	第70页
4.7.2 压缩速度评估	第70-71页
4.7.3 压缩率评估	第71-72页
4.7.4 哈希表规模的选择	第72-73页
4.7.5 解压缩	第73-75页
4.8 结论	第75-77页
第五章基于图形处理器并行化Deflate压缩算法的研究	第77-97页
5.1 Deflate压缩算法	第77-81页
5.1.1 哈夫曼编码	第77-78页
5.1.2 Deflate压缩算法	第78-81页
5.2 已有工作	第81-84页
5.3 在GPU上并行化哈夫曼编码算法	第84-93页
5.3.1 字符频率统计	第84-88页
5.3.2 构建哈夫曼树	第88-89页
5.3.3 编码	第89-93页
5.4 性能评估	第93-96页
5.4.1 基于GPU的哈夫曼编码算法压缩速率	第93-94页
5.4.2 基于GPU的Deflate算法压缩速率	第94页
5.4.3 压缩率	第94-96页
5.5 结论	第96-97页
第六章总结与展望	第97-99页
参考文献	第99-109页
致谢	第109-111页
在读期间发表的学术论文	第111页