基于数据挖掘分类算法的钓鱼网站检测研究
| 摘要 | 第3-4页 |
| abstract | 第4-5页 |
| 第1章 绪论 | 第8-16页 |
| 1.1 研究背景及研究意义 | 第8-11页 |
| 1.2 国内外研究现状 | 第11-14页 |
| 1.2.1 国外研究现状 | 第11-13页 |
| 1.2.2 国内研究现状 | 第13-14页 |
| 1.2.3 文献综述 | 第14页 |
| 1.3 论文主要研究内容及结构安排 | 第14-16页 |
| 1.3.1 论文主要研究内容 | 第14-15页 |
| 1.3.2 论文结构安排 | 第15-16页 |
| 第2章 相关理论研究 | 第16-31页 |
| 2.1 网络钓鱼 | 第16-24页 |
| 2.1.1 网络钓鱼攻击原理 | 第16-17页 |
| 2.1.2 钓鱼网站传播方式 | 第17页 |
| 2.1.3 常见几类钓鱼网站 | 第17-20页 |
| 2.1.4 攻击类别 | 第20-24页 |
| 2.2 数据挖掘与机器学习 | 第24-28页 |
| 2.2.1 数据挖掘 | 第24-27页 |
| 2.2.2 机器学习 | 第27-28页 |
| 2.3 分类问题概述 | 第28-29页 |
| 2.4 不平衡分类问题概述 | 第29-31页 |
| 2.4.1 不平衡数据分类的基本概念 | 第29-30页 |
| 2.4.2 不平衡数据分类评价指标 | 第30-31页 |
| 第3章 钓鱼网站特征提取与特征选择 | 第31-41页 |
| 3.1 钓鱼网站特征提取 | 第31-36页 |
| 3.2 钓鱼网站特征选择 | 第36-41页 |
| 3.2.1 PCA主成分分析法 | 第36-38页 |
| 3.2.2 特征选择与分析 | 第38-41页 |
| 第4章 分类器模型的比较 | 第41-55页 |
| 4.1 基于三种分类算法的钓鱼网站检测模型 | 第41-47页 |
| 4.1.1 SVM分类模型 | 第41-44页 |
| 4.1.2 随机森林算法模型 | 第44-45页 |
| 4.1.3 RBF神经网络算法模型 | 第45-47页 |
| 4.2 分类模型检测性能比较 | 第47-55页 |
| 4.2.1 实验样本集 | 第48页 |
| 4.2.2 实验环境 | 第48页 |
| 4.2.3 检测指标 | 第48-50页 |
| 4.2.5 实验结果 | 第50-55页 |
| 第5章 基于KELM算法的钓鱼网站检测优化模型 | 第55-62页 |
| 5.1 KELM—核极限学习机算法 | 第55-59页 |
| 5.1.1 极限学习机算法 | 第55-58页 |
| 5.1.2 核极限学习机 | 第58-59页 |
| 5.2 模型构建与检验 | 第59-62页 |
| 5.2.1 实验数据集 | 第59页 |
| 5.2.2 实验结果分析 | 第59-62页 |
| 第6章 结论与展望 | 第62-64页 |
| 6.1 论文工作总结 | 第62-63页 |
| 6.2 研究展望 | 第63-64页 |
| 参考文献 | 第64-67页 |
| 个人简介及攻读学位期间获得成果 | 第67-68页 |
| 致谢 | 第68页 |