未明协议格式特征提取与报文分类

摘要	第4-6页
Abstract	第6-7页
第一章绪论	第13-23页
1.1 选题背景与意义	第13-14页
1.2 国内外研究现状	第14-18页
1.2.1 混合流量分离	第14-15页
1.2.2 未明流量特征提取	第15-16页
1.2.3 大数据处理	第16-18页
1.3 关键问题分析	第18-21页
1.3.1 聚类特征矢量构造及相关聚类问题	第18-19页
1.3.2 关键词序列提取问题	第19页
1.3.3 固定位置关键词挖掘的时间效率问题	第19-21页
1.4 论文主要工作及结构安排	第21-23页
第二章基于熵估计的未明流量自动分离算法	第23-32页
2.1 EMEE系统模型	第23-28页
2.1.1 问题分析和思路	第23-25页
2.1.2 EMEE算法	第25-28页
2.2 实验分析	第28-31页
2.2.1 实验数据	第28页
2.2.2 聚类结果及分析	第28-30页
2.2.3 种类数估计	第30-31页
2.3 本章小结	第31-32页
第三章基于字节链路的报文格式特征提取迭代算法	第32-48页
3.1 BLIS系统模型	第32-43页
3.1.1 问题分析和思路	第32-36页
3.1.2 BLIS算法	第36-43页
3.2 实验分析	第43-47页
3.2.1 参数设置	第44-45页
3.2.2 不同方法报文挖掘形式对比分析	第45-46页
3.2.3 应用层特征性能分析	第46-47页
3.3 本章小结	第47-48页
第四章基于Hadoop平台的未明流量关键词提取系统	第48-58页
4.1 未明流量关键词提取系统	第48-49页
4.2 改进的频繁模式挖掘算法	第49-51页
4.2.1 改进的Apriori算法	第49-50页
4.2.2 改进的FP-Growth算法	第50-51页
4.3 频繁模式挖掘并行算法设计	第51-54页
4.3.1 Hadoop平台	第51-52页
4.3.2 改进的Apriori并行算法设计	第52-53页
4.3.3 改进的FP-Growth并行算法设计	第53-54页
4.4 实验测试与分析	第54-57页
4.4.1 实验环境设置和实验数据	第54-55页
4.4.2 并行算法运行结果	第55-56页
4.4.3 改进Apriori算法串并行分析	第56页
4.4.4 改进FP-Growth算法串并行分析	第56-57页
4.5 本章小结	第57-58页
第五章结束语	第58-60页
5.1 全文总结	第58页
5.2 工作展望	第58-60页
致谢	第60-63页
参考文献	第63-67页
作者简历	第67页