基于模板检测的违法网站识别

摘要	第3-5页
ABSTRACT	第5-6页
1 绪论	第9-17页
1.1 研究背景	第9-10页
1.2 国内外研究现状分析	第10-14页
1.2.1 黑名单	第10-11页
1.2.2 静态检测	第11-13页
1.2.3 动态检测	第13-14页
1.2.4 研究现状分析小结	第14页
1.3 研究目标和内容	第14-16页
1.4 论文结构	第16-17页
2 总体方案和关键技术研究	第17-28页
2.1 违法网站识别的总体方案	第17-20页
2.1.1 违法网站的特征分析	第17页
2.1.2 总体方案选择	第17-18页
2.1.3 评价指标	第18-19页
2.1.4 关键技术	第19-20页
2.2 模板检测特征确定	第20-24页
2.2.1 HTTP分析	第20-21页
2.2.2 HTTP POST关键特征值提取	第21-24页
2.3 网站相似度模型	第24-25页
2.3.1 构建网站特征集合	第24页
2.3.2 计算网站间相似度	第24-25页
2.4 模板抽取	第25-27页
2.4.1 网站聚类	第25-26页
2.4.2 模板抽取	第26-27页
2.5 模板检测	第27页
2.6 本章小结	第27-28页
3 原型实现和实验	第28-46页
3.1 技术框架	第28-29页
3.2 数据预处理模块的设计与实现	第29-31页
3.3 基于Map-Reduce的网站相似度计算模块的设计与实现	第31-35页
3.3.1 Map-Reduce模型和Hadoop平台	第31-32页
3.3.2 技术实现	第32-35页
3.4 违法网站模板抽取模块的设计与实现	第35-36页
3.5 违法网站识别模块的设计与实现	第36-38页
3.6 实验	第38-44页
3.6.1 实验环境	第38-39页
3.6.2 实验数据	第39页
3.6.3 实验一	第39-41页
3.6.4 实验二	第41-43页
3.6.5 实验三	第43-44页
3.7 本章小结	第44-46页
4 基于聚类图分析的网站相似度模型优化	第46-58页
4.1 图分析的相关工作	第46-47页
4.2 研究步骤	第47-48页
4.3 提取图特征	第48-49页
4.4 模式与异常	第49-54页
4.4.1 模式	第49-52页
4.4.2 异常	第52-54页
4.5 模型改进	第54-56页
4.6 实验四	第56页
4.7 本章小结	第56-58页
5 总结与展望	第58-60页
5.1 本文工作小结	第58-59页
5.2 展望	第59-60页
参考文献	第60-63页
致谢	第63-64页
攻读学位期间发表的学术论文	第64-66页