摘要 | 第5-6页 |
ABSTRACT | 第6-7页 |
第一章 绪论 | 第10-14页 |
1.1 研究背景 | 第10-11页 |
1.2 研究意义 | 第11-12页 |
1.3 论文结构 | 第12-14页 |
第二章 URL匹配及Spark框架性能影响因素分析 | 第14-25页 |
2.1 DPI架构分析 | 第14-16页 |
2.1.1 数据包检测技术 | 第14-15页 |
2.1.2 DPI架构 | 第15-16页 |
2.2 URL匹配方式分析 | 第16-19页 |
2.2.1 全局遍历 | 第16-17页 |
2.2.2 状态机 | 第17-18页 |
2.2.3 二分查找 | 第18-19页 |
2.2.4 使用hash值 | 第19页 |
2.3 用户行为提取策略分析 | 第19-20页 |
2.3.1 PDU数据解析 | 第19-20页 |
2.3.2 log分析 | 第20页 |
2.4 Spark框架及性能影响因素分析 | 第20-24页 |
2.4.1 Spark框架 | 第20-21页 |
2.4.2 RDD数据集 | 第21-22页 |
2.4.3 Spark作业执行逻辑分析 | 第22-23页 |
2.4.4 Spark性能分析及优化 | 第23-24页 |
2.5 本章小结 | 第24-25页 |
第三章 MPPM算法的设计与实现 | 第25-40页 |
3.1 问题描述 | 第25-26页 |
3.2 规则库索引构建 | 第26-33页 |
3.2.1 规则库构建 | 第26-29页 |
3.2.2 规则的预处理和分类 | 第29-31页 |
3.2.3 构建索引 | 第31-33页 |
3.3 基于索引的快速匹配算法 | 第33-39页 |
3.3.1 多模式快速匹配算法 | 第33-36页 |
3.3.2 并行多模式快速匹配算法 | 第36-39页 |
3.4 本章小结 | 第39-40页 |
第四章 MPPM算法的性能分析及优化 | 第40-57页 |
4.1 MPPM算法性能分析 | 第40-44页 |
4.2 MPPM算法性能优化 | 第44-50页 |
4.2.1 URL预处理优化 | 第44-46页 |
4.2.2 索引构建优化 | 第46-48页 |
4.2.3 匹配优化 | 第48-50页 |
4.3 MPPM算法性能测试 | 第50-56页 |
4.3.1 测试准备 | 第50-51页 |
4.3.2 算法准确性测试 | 第51-52页 |
4.3.3 关键字长度性能测试 | 第52-54页 |
4.3.4 算法并行化测试 | 第54-55页 |
4.3.5 算法并行度性能测试 | 第55-56页 |
4.4 本章小结 | 第56-57页 |
第五章 基于MPPM算法的网络流量分析及URL匹配 | 第57-68页 |
5.1 实验环境 | 第57-58页 |
5.2 基于MPPM算法的网络流量分析 | 第58-62页 |
5.2.1 电商用户行为分析 | 第58-60页 |
5.2.2 视频用户行为分析 | 第60-62页 |
5.3 基于MPPM算法的URL快速匹配 | 第62-67页 |
5.3.1 问题描述 | 第62页 |
5.3.2 构建索引并行化 | 第62-64页 |
5.3.3 shuffle优化 | 第64-66页 |
5.3.4 性能分析 | 第66-67页 |
5.4 本章小结 | 第67-68页 |
第六章 总结与展望 | 第68-70页 |
参考文献 | 第70-73页 |
致谢 | 第73-74页 |
攻读学位期间发表的学术论文目录 | 第74页 |