互联网流量分类的若干关键问题研究
摘要 | 第5-7页 |
ABSTRACT | 第7-9页 |
第一章 绪论 | 第16-29页 |
1.1 研究背景和意义 | 第16-19页 |
1.1.1 研究背景 | 第16-18页 |
1.1.2 研究意义 | 第18-19页 |
1.2 互联网流量分类面临的挑战 | 第19-22页 |
1.3 面向类不平衡和概念漂移的流量分类系统框架 | 第22-25页 |
1.3.1 基准数据集构建模块 | 第23-24页 |
1.3.2 异常流量识别模块 | 第24页 |
1.3.3 分类器训练模块 | 第24-25页 |
1.3.4 在线流量分类模块 | 第25页 |
1.4 研究目标和主要贡献 | 第25-27页 |
1.5 论文组织结构 | 第27-29页 |
第二章 互联网流量分类技术的研究现状 | 第29-50页 |
2.1 互联网测量技术 | 第29-30页 |
2.2 互联网流量分类研究现状 | 第30-38页 |
2.2.1 基于端口号的流量分类方法 | 第30页 |
2.2.2 基于报文载荷的流量分类方法 | 第30-31页 |
2.2.3 基于主机通信行为的流量分类方法 | 第31-32页 |
2.2.4 基于机器学习的流量分类方法 | 第32-38页 |
2.3 互联网流量分类若干关键问题研究 | 第38-45页 |
2.3.1 类不平衡的相关工作 | 第38-41页 |
2.3.2 概念漂移的相关工作 | 第41-44页 |
2.3.3 异常流量识别相关工作 | 第44-45页 |
2.4 互联网流量分类研究组织 | 第45-49页 |
2.4.1 国外研究组织 | 第45-47页 |
2.4.2 国内研究组织 | 第47-49页 |
2.5 本章小结 | 第49-50页 |
第三章 互联网流量的微调重采样方法 | 第50-64页 |
3.1 引言 | 第50-51页 |
3.2 互联网流量数据的类不平衡性 | 第51-53页 |
3.2.1 互联网流量数据集 | 第51-53页 |
3.2.2 流量数据不平衡性 | 第53页 |
3.3 微调重采样方法 | 第53-56页 |
3.4 互联网流量分类实验结果分析 | 第56-62页 |
3.4.1 分类性能评估指标 | 第56-57页 |
3.4.2 实验设计 | 第57-59页 |
3.4.3 基本流量分类性能 | 第59-61页 |
3.4.4 流量分类稳定性 | 第61-62页 |
3.5 本章小结 | 第62-64页 |
第四章 基于数据清理的流量分类方法 | 第64-84页 |
4.1 引言 | 第64-65页 |
4.2 相关工作 | 第65-66页 |
4.3 实验数据集与分类性能评估指标 | 第66-70页 |
4.3.1 互联网流量数据集 | 第66-69页 |
4.3.2 流量分类性能评估指标 | 第69-70页 |
4.4 基于数据清理的流量分类方法 | 第70-79页 |
4.4.1 K近邻算法 | 第70-73页 |
4.4.2 低字节分类准确率的讨论 | 第73-76页 |
4.4.3 IENN方法 | 第76-79页 |
4.5 实验结果分析 | 第79-83页 |
4.5.1 实验设计 | 第79页 |
4.5.2 基本流量分类性能比较 | 第79-81页 |
4.5.3 在线流量分类场景的分类性能比较 | 第81-82页 |
4.5.4 参数讨论 | 第82-83页 |
4.6 本章小结 | 第83-84页 |
第五章 基于单类概念漂移探测的流量分类框架 | 第84-104页 |
5.1 引言 | 第84-86页 |
5.2 互联网流量数据集及其概念漂移情况 | 第86-88页 |
5.2.1 互联网流量数据 | 第86页 |
5.2.2 流量数据集上的概念漂移 | 第86-88页 |
5.3 基于PCDD的互联网流量分类框架 | 第88-98页 |
5.3.1 概念漂移探测方法 | 第88-95页 |
5.3.2 样本缓存控制 | 第95-96页 |
5.3.3 分类器模型 | 第96-97页 |
5.3.4 基于PCDD的流量分类框架 | 第97-98页 |
5.4 互联网流量分类实验结果 | 第98-102页 |
5.4.1 流量分类性能评价指标 | 第98-99页 |
5.4.2 概念漂移探测性能比较 | 第99-101页 |
5.4.3 分类模型更新次数与训练集规模 | 第101-102页 |
5.5 本章小结 | 第102-104页 |
第六章 基于信息熵的异常流量识别方法 | 第104-128页 |
6.1 引言 | 第104页 |
6.2 基于信息熵的异常流量识别方法 | 第104-113页 |
6.2.1 互联网流量数据 | 第104-106页 |
6.2.2 互联网流量来源分布分析 | 第106-107页 |
6.2.3 信息熵与相对不确定性 | 第107页 |
6.2.4 异常流量识别方法框架 | 第107-108页 |
6.2.5 不活跃IP识别算法 | 第108-112页 |
6.2.6 异常流量识别算法 | 第112-113页 |
6.3 IPV4 基准数据集上的性能评估 | 第113-119页 |
6.3.1 基准数据集建立 | 第113-114页 |
6.3.2 基准数据上的不活跃IP分布 | 第114-115页 |
6.3.3 性能评估指标 | 第115页 |
6.3.4 异常流量识别方法的参数与性能分析 | 第115-117页 |
6.3.5 假设检验分析 | 第117-119页 |
6.4 NETFLOW数据上的实验分析 | 第119-124页 |
6.4.1 NetFlow流量数据 | 第119-120页 |
6.4.2 不活跃IP及恶意源IP分析 | 第120-122页 |
6.4.3 异常流量验证分析 | 第122-124页 |
6.5 IPV6 数据集上的性能分析 | 第124-126页 |
6.6 本章小结 | 第126-128页 |
总结与展望 | 第128-131页 |
工作总结 | 第128-130页 |
研究展望 | 第130-131页 |
参考文献 | 第131-141页 |
攻读博士学位期间取得的研究成果 | 第141-143页 |
致谢 | 第143-144页 |
附件 | 第144页 |