首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

网站反爬取机制的研究与应用

摘要第4-5页
ABSTRACT第5页
第一章 绪论第8-15页
    1.1 研究背景与意义第8-9页
    1.2 国内外研究现状第9-13页
        1.2.1 爬虫综述第9-12页
        1.2.2 现阶段主流反爬取手段第12-13页
    1.3 本人工作第13页
    1.4 论文组织结构第13-14页
    1.5 本章小结第14-15页
第二章 反爬取主流方案研究与分析第15-26页
    2.1 现阶段反爬取机制第15页
    2.2 基于日志的反爬取机制第15-19页
        2.2.1 机制原理研究第15-17页
        2.2.2 关键点分析第17-19页
        2.2.3 优势与不足分析第19页
    2.3 基于实时访问的反爬取机制第19-22页
        2.3.1 机制原理研究第19-20页
        2.3.2 关键点分析第20-21页
        2.3.3 优势与不足分析第21-22页
    2.4 基于陷阱技术的反爬取机制第22-24页
        2.4.1 机制原理研究第22-23页
        2.4.2 关键点分析第23-24页
        2.4.3 优势与不足分析第24页
    2.5 研究目标第24页
    2.6 本章小结第24-26页
第三章 一种高精度的实时反爬取机制的设计第26-40页
    3.1 设计目标第26页
    3.2 反爬取机制整体架构第26-30页
        3.2.1 原Web服务器端架构第27-28页
        3.2.2 反爬取服务器端架构第28-30页
    3.3 主要模块详细分析设计第30-39页
        3.3.1 数据接收发送模块第30-32页
        3.3.2 请求拦截封禁模块第32-34页
        3.3.3 爬虫判别模块第34-35页
        3.3.4 系统管理模块第35-36页
        3.3.5 数据存储模块第36-39页
    3.4 本章小结第39-40页
第四章 反爬取算法的研究第40-55页
    4.1 反爬取算法的选取第40页
    4.2 基于决策树的反爬取算法第40-46页
        4.2.1 决策树第40-43页
        4.2.2 决策树特征选择和优化第43-44页
        4.2.3 基于决策树的爬虫检测算法的生成第44-46页
        4.2.4 决策树优化第46页
    4.3 基于滑动窗口和SVM的反爬取算法第46-54页
        4.3.1 滑动窗口第46-47页
        4.3.2 SVM算法第47-49页
        4.3.3 爬虫访问特征分析和提取第49-51页
        4.3.4 权值计算第51-52页
        4.3.5 基于滑动时间窗口和SVM算法的爬虫检测算法第52-54页
    4.4 本章小结第54-55页
第五章 机制应用与效果分析第55-62页
    5.1 反爬取机制的应用第55-58页
        5.1.1 原Web服务器端组件实现第55-57页
        5.1.2 反爬取服务器端组件实现第57-58页
    5.2 反爬取的数据集获取第58页
    5.3 评价方式第58-59页
    5.4 效果分析第59-61页
    5.5 本章小结第61-62页
第六章 总结与展望第62-64页
    6.1 本文小结第62页
    6.2 工作展望第62-64页
参考文献第64-66页
致谢第66-67页
攻读学位期间发表的学术论文目录第67页

论文共67页,点击 下载论文
上一篇:一种高适应性的网页信息抽取机制的设计与实现
下一篇:基于大数据平台的贝叶斯网络增量学习方法研究与应用