首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

针对信息披露网站的实时爬虫检测与拦截

摘要第4-5页
Abstract第5-6页
第1章 绪论第9-14页
    1.1 项目背景及研究的目的和意义第9-10页
    1.2 国内外研究现状第10-12页
        1.2.1 爬虫检测研究现状第10-11页
        1.2.2 爬虫拦截现状第11页
        1.2.3 爬虫实时检测与拦截现状第11-12页
    1.3 论文研究内容及组织结构第12-14页
        1.3.1 研究内容第12页
        1.3.2 章节内容组织第12-14页
第2章 背景知识第14-23页
    2.1 引言第14页
    2.2 爬虫工作原理介绍第14-15页
    2.3 爬虫检测方法第15-17页
        2.3.1 爬虫检测介绍第15-16页
        2.3.2 分类方法介绍第16-17页
    2.4 访问控制与拦截方法第17-19页
    2.5 实时计算技术介绍第19-22页
        2.5.1 数据实时传输方法介绍第19-20页
        2.5.2 分布式实时计算技术第20-22页
    2.6 本章小结第22-23页
第3章 基于访问日志的实时SVM爬虫检测方法与爬虫拦截方法第23-44页
    3.1 引言第23页
    3.2 日志实时采集方法第23-26页
        3.2.1 数据并发量分析及实时传输方法第23-25页
        3.2.2 数据实时接收及处理方法第25-26页
    3.3 数据预处理第26-28页
        3.3.1 时间窗同步第26-27页
        3.3.2 数据时序处理第27-28页
    3.4 基于SVM的实时爬虫检测算法设计第28-40页
        3.4.1 爬虫特征分析第28-31页
        3.4.2 特征数据提取第31-33页
        3.4.3 数据处理第33-34页
        3.4.4 爬虫检测算法实验分析第34-40页
    3.5 爬虫的拦截方法第40-43页
        3.5.1 访问干扰机制分析第40-41页
        3.5.2 拦截与容错第41-42页
        3.5.3 拦截方法分析第42-43页
    3.6 本章小结第43-44页
第4章 基于访问日志的实时SVM爬虫检测及爬虫拦截系统设计与实现第44-56页
    4.1 引言第44页
    4.2 系统架构设计第44-51页
        4.2.1 日志采集模块第45-47页
        4.2.2 行为特征提取第47-48页
        4.2.3 爬虫分析模型第48-49页
        4.2.4 爬虫推送模块第49-50页
        4.2.5 爬虫验证模块第50页
        4.2.6 请求拦截模块第50-51页
    4.3 系统部署第51-52页
        4.3.1 运行环境说明第51页
        4.3.2 系统运行情况第51-52页
    4.4 系统测试第52-54页
    4.5 测试结果分析第54-55页
    4.6 本章小结第55-56页
结论第56-57页
参考文献第57-62页
致谢第62-63页
个人简历第63页

论文共63页,点击 下载论文
上一篇:面向金融投资者及机构的信息咨询引擎系统研究
下一篇:大功率光伏逆变器的热设计及其结构优化