移动互联网的文件分类审计系统研究与实现

致谢	第5-6页
摘要	第6-7页
ABSTRACT	第7-8页
1 绪论	第12-18页
1.1 研究背景及意义	第12-13页
1.2 国内外研究现状	第13-15页
1.3 论文研究内容	第15-16页
1.4 论文的组织结构	第16-18页
2 相关技术介绍	第18-30页
2.1 数据包捕获技术	第18-20页
2.1.1 Libpcap技术	第18-19页
2.1.2 BPF技术	第19-20页
2.2 深度包检测技术	第20-21页
2.2.1 深度包检测技术介绍	第20页
2.2.2 DPI技术特点	第20-21页
2.3 文件类型识别相关技术	第21-22页
2.3.1 基于后缀名的文件类型识别	第21页
2.3.2 基于特征标识的文件类型识别	第21-22页
2.3.3 基于内容的文件类型识别	第22页
2.4 网页分类相关技术	第22-27页
2.4.1 网页内容抽取	第23-24页
2.4.2 中文分词	第24-25页
2.4.3 文本特征提取算法	第25页
2.4.4 NB分类算法	第25-26页
2.4.5 KNN分类算法	第26页
2.4.6 SVM分类算法	第26-27页
2.5 二维码识别相关技术	第27页
2.6 Jemalloc内存管理技术	第27-29页
2.7 本章小结	第29-30页
3 文件分类审计系统的关键技术研究	第30-42页
3.1 中文网页特征提取	第30-33页
3.1.1 卡方统计特征提取算法	第30-31页
3.1.2 基于卡方统计的优化特征提取算法	第31页
3.1.3 实验步骤与结果	第31-33页
3.2 基于限定区域的文件标识匹配方法	第33-37页
3.2.1 基于特征标识文件分类流程	第33-34页
3.2.2 文件特征标识描述	第34-36页
3.2.3 基于限定区域的文件标识匹配	第36-37页
3.2.4 实验步骤与结果	第37页
3.3 多进程架构的性能优化	第37-40页
3.3.1 基于负载均衡的数据分流	第38-39页
3.3.2 父子心跳问题处理	第39页
3.3.3 内存优化	第39-40页
3.4 本章小结	第40-42页
4 移动互联网的文件分类审计系统	第42-56页
4.1 设计目标与设计原则	第42-43页
4.1.1 系统设计目标	第42页
4.1.2 系统设计原则	第42-43页
4.2 系统结构	第43-44页
4.2.1 系统部署	第43页
4.2.2 系统结构	第43-44页
4.3 模块实现	第44-54页
4.3.1 数据采集模块	第44-45页
4.3.2 协议解析及应用识别模块	第45-53页
4.3.3 数据存储模块	第53-54页
4.4 本章小结	第54-56页
5 系统实现与测试	第56-66页
5.1 系统总体实现	第56-57页
5.2 关键功能实现	第57-61页
5.2.1 实时分析实现	第57-59页
5.2.2 文件类型审计实现	第59-60页
5.2.3 网页分类审计实现	第60-61页
5.3 实验结果与分析	第61-65页
5.3.1 实验环境	第61-62页
5.3.2 功能测试	第62页
5.3.3 性能测试	第62-65页
5.4 本章小结	第65-66页
6 总结与展望	第66-68页
6.1 工作总结	第66页
6.2 工作展望	第66-68页
参考文献	第68-72页
作者简历及攻读硕士学位期间取得的研究成果	第72-76页
学位论文数据集	第76页