首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于Hadoop的应用层协议识别技术研究

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第11-15页
    1.1 研究背景及意义第11-12页
    1.2 国内外研究现状第12-13页
    1.3 本文的主要工作第13-14页
    1.4 本论文的结构安排第14-15页
第二章 相关技术基础第15-30页
    2.1 云计算第15-23页
        2.1.1 云计算概述第15-16页
        2.1.2 Hadoop第16-19页
            2.1.2.1 Hadoop家族第17页
            2.1.2.2 HDFS的体系架构第17-18页
            2.1.2.3 Map Reduce的工作原理第18-19页
        2.1.3 HBase第19-23页
            2.1.3.1 HBase的体系架构第19-21页
            2.1.3.2 HBase中两张特殊的表第21页
            2.1.3.3 HBase概念视图与物理视图第21-23页
    2.2 协议识别技术第23-28页
        2.2.1 基于知名端.的应用层协议识别技术第23-24页
        2.2.2 基于统计学的应用层协议识别技术第24-25页
        2.2.3 基于深度包检测的应用层协议识别技术第25-26页
        2.2.4 基于特征字匹配的应用层协议识别技术第26-27页
        2.2.5 基于正则表达式的应用层协议识别技术第27-28页
    2.3 网络抓包工具WireShark第28-29页
    2.4 本章小结第29-30页
第三章 基于HADOOP的特征串提取算法的研究实现与改进第30-51页
    3.1 基于Hadoop的Apriori算法及改进第30-40页
        3.1.1 Apriori算法简介第30-36页
            3.1.1.1 关联规则发现第30-31页
            3.1.1.2 关联规则相关的概念与定理第31-32页
            3.1.1.3 Apriori算法第32-36页
            3.1.1.4 Apriori算法与应用层协议特征提取第36页
        3.1.2 基于Hadoop的应用层协议特征串提取MapReduceApriori算法第36-40页
            3.1.2.1 MapReduceApriori算法的基本思想第36页
            3.1.2.2 MapReduceApriori算法的设计与实现第36-39页
            3.1.2.3 设计实现的改进第39-40页
    3.2 基于Hadoop的应用层协议特征串提取MapReduceApriori改进算法第40-50页
        3.2.1 对每一个数据包添加编码第40-42页
        3.2.2 基于Hadoop的优化第42-45页
            3.2.2.1 使用Combiner减少网络流量第42-44页
            3.2.2.2 使用压缩数据,减少输入输出第44页
            3.2.2.3 重用JVM第44-45页
            3.2.2.4 Reduce的数量设置第45页
        3.3.3 算法改进后的框架第45-50页
    3.3 本章小结第50-51页
第四章 基于HADOOP的应用层协议识别系统的设计与实现第51-71页
    4.1 系统总体设计第51-53页
    4.2 数据预处理模块第53-58页
        4.2.1 去除与数据包无关的字符第54页
        4.2.2 提取源IP、源端.、目的IP、目的端.、应用层数据第54-55页
        4.2.3 重组数据包,得到目标数据集第55-58页
            4.2.3.1 TCP数据重组第56-58页
            4.2.3.2 UDP数据重组第58页
    4.3 基于Hadoop的应用层识别模块第58-69页
        4.3.1 特征库的设计第58-62页
            4.3.1.1 数据流1特征表第58-59页
            4.3.1.2 端.表第59页
            4.3.1.3 数据流2特征表第59-60页
            4.3.1.4 正则表达式特征表第60-61页
            4.3.1.5 特征串1特征表第61-62页
            4.3.1.6 特征串2特征表第62页
        4.3.2 基于数据流2的识别单元模块第62-64页
        4.3.3 基于数据流1的识别单元模块第64-65页
        4.3.4 基于正则表达式的识别单元模块第65-67页
        4.3.5 基于特征串的识别单元模块第67-69页
    4.4 基于Hadoop的应用层协议特征串提取模块第69-70页
    4.5 本章小结第70-71页
第五章 实验结果与分析第71-88页
    5.1 实验平台搭建第71-76页
        5.1.1 Hadoop集群搭建第71-74页
            5.1.1.1 Hadoop集群配置第71-72页
            5.1.1.2 Hadoop集群安装第72-74页
        5.1.2 NTP服务器搭建第74-75页
        5.1.3 HBase集群搭建第75-76页
    5.2 实验目的设计与结果分析第76-87页
        5.2.1 性能优化提升实验第76-82页
            5.2.1.1 使用Combiner减少网络流量实验目的设计与结果分析第76-78页
            5.2.1.2 使用压缩数据,减少输入输出实验目的设计与结果分析第78-80页
            5.2.1.3 重用JVM实验结果与分析第80-81页
            5.2.1.4 Reduce的数量设置实验第81-82页
        5.2.2 应用层协议识别模块实验第82-83页
            5.2.2.1 实验目的第82页
            5.2.2.2 实验设计第82-83页
            5.2.2.3 实验结果与分析第83页
        5.2.3 应用层协议的特征串提取模块实验第83-87页
            5.2.3.1 实验目的第83页
            5.2.3.2 实验设计第83-84页
            5.2.3.3 实验结果与分析第84-87页
    5.3 本章小结第87-88页
第六章 总结与展望第88-89页
    6.1 总结第88页
    6.2 后续工作展望第88-89页
致谢第89-90页
参考文献第90-93页
攻读硕士学位期间取得的成果第93-94页

论文共94页,点击 下载论文
上一篇:基于单点登录的互联网统一身份认证系统的设计与实现
下一篇:基于流量的木马检测技术