基于AdaBoost算法的网络钓鱼检测系统的研究
摘要 | 第4-5页 |
Abstract | 第5页 |
第一章 绪论 | 第8-14页 |
1.1 研究的背景和意义 | 第8-9页 |
1.2 国内外研究现状 | 第9-12页 |
1.2.1 基于黑白名单检测机制 | 第10页 |
1.2.2 基于网站链接检测机制 | 第10-11页 |
1.2.3 基于页面相似度检测机制 | 第11-12页 |
1.2.4 身份认证机制 | 第12页 |
1.3 研究内容和目的 | 第12-13页 |
1.4 本文组织结构 | 第13-14页 |
第二章 相关技术研究 | 第14-19页 |
2.1 网络钓鱼攻击技术 | 第14-16页 |
2.2 机器学习简介 | 第16页 |
2.3 AdaBoost算法原理 | 第16-17页 |
2.4 分词技术 | 第17-18页 |
2.4.1 正向最大匹配法 | 第17-18页 |
2.4.2 逆向最大匹配法 | 第18页 |
2.4.3 双向最大匹配法 | 第18页 |
2.5 本章小结 | 第18-19页 |
第三章 网络钓鱼检测系统的设计 | 第19-37页 |
3.1 当前网络钓鱼检测技术比较 | 第19-20页 |
3.2 系统设计流程 | 第20-21页 |
3.3 黑白名单过滤 | 第21页 |
3.4 URL中特征提取 | 第21-26页 |
3.5 网页结构中提取特征 | 第26-29页 |
3.6 网页内容中提取特征 | 第29-33页 |
3.6.1 分词处理流程 | 第30-31页 |
3.6.2 TF-IDF与特征值计算 | 第31-33页 |
3.7 数据预处理 | 第33-36页 |
3.7.1 矩阵、特征值基础知识 | 第33-34页 |
3.7.2 矩阵分解 | 第34-35页 |
3.7.3 低阶近似 | 第35-36页 |
3.8 分类器检测 | 第36页 |
3.9 人工审核 | 第36页 |
3.10 本章小结 | 第36-37页 |
第四章 分类器模型的选取 | 第37-50页 |
4.1 K-近邻算法模型 | 第37页 |
4.2 朴素贝叶斯模型 | 第37-39页 |
4.3 逻辑回归 | 第39-41页 |
4.4 分类器检测性能比较 | 第41-45页 |
4.4.1 检测主要指标 | 第42-43页 |
4.4.2 实验样本集 | 第43-44页 |
4.4.3 实验结果 | 第44-45页 |
4.5 AdaBoost算法的改进 | 第45-46页 |
4.6 实验结果与分析 | 第46-49页 |
4.6.1 非均衡性指标评价 | 第46-47页 |
4.6.2 实验数据的选取 | 第47页 |
4.6.3 训练样本集中正负样本的比例 | 第47-48页 |
4.6.4 实验结果 | 第48-49页 |
4.7 本章小结 | 第49-50页 |
第五章 总结和展望 | 第50-52页 |
5.1 论文工作总结 | 第50页 |
5.2 研究展望 | 第50-52页 |
参考文献 | 第52-55页 |
致谢 | 第55-56页 |
攻读学位期间的研究成果 | 第56-57页 |