中英混合多模式匹配算法的改进及GPU并行化研究

摘要	第5-6页
Abstract	第6页
插图索引	第10-11页
附表索引	第11-12页
第1章绪论	第12-19页
1.1 研究背景	第12-13页
1.2 相关研究问题	第13-16页
1.2.1 多模式匹配	第13页
1.2.2 Trie 结构	第13页
1.2.3 中英文混合环境	第13-14页
1.2.4 GPU 并行处理	第14-15页
1.2.5 CUDA 架构	第15-16页
1.2.6 面临的困难和挑战	第16页
1.3 研究内容与贡献	第16-17页
1.3.1 研究思路与内容	第16-17页
1.3.2 研究贡献	第17页
1.4 论文组织结构	第17-19页
第2章相关研究	第19-27页
2.1 引言	第19-20页
2.2 多模式匹配算法	第20-21页
2.2.1 前缀搜索	第20页
2.2.2 后缀搜索	第20-21页
2.2.3 子串搜索	第21页
2.3 中英文混合环境下的匹配算法	第21-25页
2.3.1 所有字节的完全哈希的匹配算法	第22页
2.3.2 基于字符拆分的匹配算法	第22页
2.3.3 基于跳跃的多模式匹配算法	第22页
2.3.4 完全哈希算法	第22-24页
2.3.5 线索化的完全哈希算法	第24-25页
2.4 多模式匹配的并行化	第25页
2.4.1 Brute Force 算法并行化	第25页
2.4.2 增加冗余信息的匹配并行化	第25页
2.4.3 并行化的 AC 算法	第25页
2.5 结论	第25-27页
第3章基于节点添加的中英混合多模式匹配	第27-38页
3.1 引言	第27-28页
3.2 基于节点添加的完全哈希 Trie 算法	第28-33页
3.2.1 Trie 结构的线索化	第28-29页
3.2.2 中文字符的错位匹配	第29-30页
3.2.3 Trie 结构上的节点添加算法	第30-32页
3.2.4 构建完全的状态转移	第32-33页
3.2.5 基于节点添加的文本匹配过程	第33页
3.3 记忆化存储状态结果	第33-35页
3.3.1 当前状态所含的匹配数	第33-34页
3.3.2 优化的文本匹配过程	第34-35页
3.4 多字节汉字编码的处理	第35-36页
3.4.1 多字节编码的节点添加	第35页
3.4.2 一种折中的实时添加策略	第35-36页
3.5 时空复杂度分析	第36页
3.5.1 空间复杂度	第36页
3.5.2 时间复杂度	第36页
3.6 结论	第36-38页
第4章基于 GPU 的中英混合多模式匹配的并行化	第38-48页
4.1 引言	第38-39页
4.2 多文本并行算法	第39页
4.3 基于文本拆分的 GPU 并行算法	第39-43页
4.3.1 文本拆分	第40-41页
4.3.2 处理拆分后的小文本	第41-42页
4.3.3 文本拆分处的处理	第42-43页
4.4 GPU 并行算法的优化	第43-46页
4.4.1 并行化预处理	第43-44页
4.4.2 数据结构的存储	第44-45页
4.4.3 空间压缩	第45-46页
4.5 基于 GPU 的通用并行文本匹配原型系统	第46-47页
4.6 结论	第47-48页
第5章实验及结果分析	第48-57页
5.1 引言	第48页
5.2 实验环境	第48页
5.2.1 硬件平台	第48页
5.2.2 软件平台	第48页
5.3 实验数据	第48-49页
5.3.1 多文本实验	第49页
5.3.2 大文本实验	第49页
5.4 实验结果与分析	第49-55页
5.4.1 THT 与 NA-Trie 算法效率对比	第49-51页
5.4.2 串行/并行算法效率对比	第51-54页
5.4.3 模式串数量对匹配效率的影响	第54-55页
5.5 结论	第55-57页
结论	第57-59页
参考文献	第59-63页
附录A 攻读硕士学位期间发表论文	第63-64页
附录B 攻读硕士学位期间参与项目及所获奖项	第64-65页
致谢	第65页