客户端钓鱼网站智能检测系统的设计与实现

摘要	第5-6页
Abstract	第6页
第1章绪论	第9-12页
1.1 研究背景与意义	第9页
1.2 国内外研究现状	第9-11页
1.3 论文的主要工作和内容安排	第11-12页
第2章网络爬虫的分析与设计	第12-20页
2.1 概述	第12页
2.2 常见的网络爬虫	第12-13页
2.3 网络爬虫的工作原理	第13页
2.4 网络爬虫算法分析	第13-14页
2.5 基于多线程的网络爬虫	第14-17页
2.5.1 网络爬虫在网络特征提取方面的应用	第14页
2.5.2 多线程网络爬虫的优势	第14-15页
2.5.3 多线程网络爬虫的关键技术	第15-17页
2.6 网络爬虫程序设计	第17-19页
2.6.1 网络爬虫开发语言	第17-18页
2.6.2 网络爬虫功能设计概述	第18-19页
2.7 本章小结	第19-20页
第3章网页特征提取	第20-33页
3.1 网页解析工具BeautifulSoup	第20-21页
3.2 网页特征的选取	第21-29页
3.2.1 URL中的IP地址	第22-23页
3.2.2 URL中下划线的数量	第23-24页
3.2.3 ICP备案号	第24页
3.2.4 网页中的链接对象	第24-25页
3.2.5 域名的注册年龄	第25-26页
3.2.6 URL的长度	第26-27页
3.2.7 网页中的表单数量	第27-28页
3.2.8 网页中的图片数量	第28-29页
3.3 网页特征提取模块的设计	第29-31页
3.3.1 引言	第29-30页
3.3.2 URL备案号的获取	第30页
3.3.3 网页中的链接对象的统计	第30-31页
3.3.4 网页中表单数量和图片数量的统计	第31页
3.4 正则表达式的简要说明	第31-32页
3.5 本章小结	第32-33页
第4章钓鱼网页的检测识别	第33-43页
4.1 SVM理论	第33-39页
4.1.1 logistic回归	第33-35页
4.1.2 线性分类的例子	第35-36页
4.1.3 函数间隔与几何间隔	第36-37页
4.1.4 最大间隔分类器的定义	第37-39页
4.2 SVM在Python中的应用	第39-40页
4.3 基于SVM的钓鱼网页分类识别方法和分析	第40-42页
4.3.1 SVM工作的前期数据准备	第40页
4.3.2 SVM在系统中的应用	第40-41页
4.3.3 基于SVM的钓鱼网页检测识别流程	第41-42页
4.4 本章小结	第42-43页
第5章系统实现与测试	第43-50页
5.1 黑名单的获取	第43-44页
5.2 白名单的获取	第44页
5.3 黑白名单的查看	第44-45页
5.4 黑白名单的样本训练库的构建	第45页
5.5 构造样本训练模型	第45-47页
5.6 系统的正常运行状态	第47-48页
5.8 系统测试结果分析	第48-49页
5.9 本章小结	第49-50页
第6章结论与展望	第50-52页
6.1 本文的主要工作	第50-51页
6.2 未来工作的展望	第51-52页
参考文献	第52-55页
致谢	第55-56页
作者简介	第56页