摘要 | 第5-6页 |
Abstract | 第6页 |
插图索引 | 第10-11页 |
附表索引 | 第11-12页 |
第1章 绪论 | 第12-19页 |
1.1 研究背景 | 第12-13页 |
1.2 相关研究问题 | 第13-16页 |
1.2.1 多模式匹配 | 第13页 |
1.2.2 Trie 结构 | 第13页 |
1.2.3 中英文混合环境 | 第13-14页 |
1.2.4 GPU 并行处理 | 第14-15页 |
1.2.5 CUDA 架构 | 第15-16页 |
1.2.6 面临的困难和挑战 | 第16页 |
1.3 研究内容与贡献 | 第16-17页 |
1.3.1 研究思路与内容 | 第16-17页 |
1.3.2 研究贡献 | 第17页 |
1.4 论文组织结构 | 第17-19页 |
第2章 相关研究 | 第19-27页 |
2.1 引言 | 第19-20页 |
2.2 多模式匹配算法 | 第20-21页 |
2.2.1 前缀搜索 | 第20页 |
2.2.2 后缀搜索 | 第20-21页 |
2.2.3 子串搜索 | 第21页 |
2.3 中英文混合环境下的匹配算法 | 第21-25页 |
2.3.1 所有字节的完全哈希的匹配算法 | 第22页 |
2.3.2 基于字符拆分的匹配算法 | 第22页 |
2.3.3 基于跳跃的多模式匹配算法 | 第22页 |
2.3.4 完全哈希算法 | 第22-24页 |
2.3.5 线索化的完全哈希算法 | 第24-25页 |
2.4 多模式匹配的并行化 | 第25页 |
2.4.1 Brute Force 算法并行化 | 第25页 |
2.4.2 增加冗余信息的匹配并行化 | 第25页 |
2.4.3 并行化的 AC 算法 | 第25页 |
2.5 结论 | 第25-27页 |
第3章 基于节点添加的中英混合多模式匹配 | 第27-38页 |
3.1 引言 | 第27-28页 |
3.2 基于节点添加的完全哈希 Trie 算法 | 第28-33页 |
3.2.1 Trie 结构的线索化 | 第28-29页 |
3.2.2 中文字符的错位匹配 | 第29-30页 |
3.2.3 Trie 结构上的节点添加算法 | 第30-32页 |
3.2.4 构建完全的状态转移 | 第32-33页 |
3.2.5 基于节点添加的文本匹配过程 | 第33页 |
3.3 记忆化存储状态结果 | 第33-35页 |
3.3.1 当前状态所含的匹配数 | 第33-34页 |
3.3.2 优化的文本匹配过程 | 第34-35页 |
3.4 多字节汉字编码的处理 | 第35-36页 |
3.4.1 多字节编码的节点添加 | 第35页 |
3.4.2 一种折中的实时添加策略 | 第35-36页 |
3.5 时空复杂度分析 | 第36页 |
3.5.1 空间复杂度 | 第36页 |
3.5.2 时间复杂度 | 第36页 |
3.6 结论 | 第36-38页 |
第4章 基于 GPU 的中英混合多模式匹配的并行化 | 第38-48页 |
4.1 引言 | 第38-39页 |
4.2 多文本并行算法 | 第39页 |
4.3 基于文本拆分的 GPU 并行算法 | 第39-43页 |
4.3.1 文本拆分 | 第40-41页 |
4.3.2 处理拆分后的小文本 | 第41-42页 |
4.3.3 文本拆分处的处理 | 第42-43页 |
4.4 GPU 并行算法的优化 | 第43-46页 |
4.4.1 并行化预处理 | 第43-44页 |
4.4.2 数据结构的存储 | 第44-45页 |
4.4.3 空间压缩 | 第45-46页 |
4.5 基于 GPU 的通用并行文本匹配原型系统 | 第46-47页 |
4.6 结论 | 第47-48页 |
第5章 实验及结果分析 | 第48-57页 |
5.1 引言 | 第48页 |
5.2 实验环境 | 第48页 |
5.2.1 硬件平台 | 第48页 |
5.2.2 软件平台 | 第48页 |
5.3 实验数据 | 第48-49页 |
5.3.1 多文本实验 | 第49页 |
5.3.2 大文本实验 | 第49页 |
5.4 实验结果与分析 | 第49-55页 |
5.4.1 THT 与 NA-Trie 算法效率对比 | 第49-51页 |
5.4.2 串行/并行算法效率对比 | 第51-54页 |
5.4.3 模式串数量对匹配效率的影响 | 第54-55页 |
5.5 结论 | 第55-57页 |
结论 | 第57-59页 |
参考文献 | 第59-63页 |
附录A 攻读硕士学位期间发表论文 | 第63-64页 |
附录B 攻读硕士学位期间参与项目及所获奖项 | 第64-65页 |
致谢 | 第65页 |