首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于隐马尔科夫模型的爬虫检测研究与实现

摘要第5-6页
Abstract第6页
第一章 绪论第10-14页
    1.1 研究背景及研究意义第10页
    1.2 国内外相关研究现状第10-12页
        1.2.1 基于访问日志语法分析的爬虫检测第10-11页
        1.2.2 基于访问模式的爬虫检测第11页
        1.2.3 基于访问行为的爬虫检测第11页
        1.2.4 基于访问序列的爬虫检测第11-12页
        1.2.5 其余检测方式第12页
        1.2.6 存在的问题第12页
    1.3 本文的工作第12-13页
    1.4 文章结构安排第13-14页
第二章 相关技术分析第14-22页
    2.1 爬虫原理第14-16页
        2.1.1 爬虫工作流程第14-15页
        2.1.2 爬行策略第15页
        2.1.3 绕过反爬虫策略第15-16页
    2.2 爬虫检测技术第16-18页
        2.2.1 根据robots.txt与user-agent检测第16页
        2.2.2 根据访问特征检测第16-17页
        2.2.3 机器学习应用爬虫检测第17-18页
        2.2.4 设置爬虫陷阱第18页
    2.3 爬虫的实时检测系统第18页
    2.4 访问日志预处理第18-21页
        2.4.1 Web访问日志内容构成第19-20页
        2.4.2 预处理目的第20页
        2.4.3 日志格式第20页
        2.4.4 步骤第20-21页
    2.5 本章小结第21-22页
第三章 制定爬虫数据集第22-28页
    3.1 研究意义与目的第22-23页
    3.2 数据集设计的依据第23-25页
        3.2.1 总结前人的爬虫经验第23-24页
        3.2.2 分析自己网站的爬虫记录第24-25页
    3.3 制定数据集第25-27页
        3.3.1 设计爬虫第25-26页
        3.3.2 网站的选择第26页
        3.3.3 爬虫数据集预估与统计第26-27页
    3.4 本章小结第27-28页
第四章 本文采用的训练模型和相关算法第28-36页
    4.1 数学模型第28-31页
        4.1.1 HMM第28-30页
        4.1.2 选择HMM的原因第30页
        4.1.3 HMM的三个基本问题第30-31页
    4.2 相关算法第31-35页
        4.2.1 前向-后向算法第31-32页
        4.2.2 Baum-Welch算法第32-34页
        4.2.3 泊松分布第34-35页
    4.3 本章小结第35-36页
第五章 基于HMM的爬虫检测第36-43页
    5.1 总体方案设计第36-37页
    5.2 提取爬虫序列第37-40页
        5.2.1 分析爬虫序列第37-39页
        5.2.2 HMM描述爬虫序列第39-40页
    5.3 爬虫模型训练第40-41页
        5.3.1 训练模型第40-41页
        5.3.2 确定爬虫分布区间第41页
        5.3.3 误差处理第41页
    5.4 模型用于爬虫检测第41-42页
    5.5 本章小结第42-43页
第六章 实验与验证第43-52页
    6.1 数据描述第43-45页
        6.1.1 训练数据第43-44页
        6.1.2 训练数据第44-45页
    6.2 模型参数与爬虫区间第45-47页
        6.2.1 模型参数第45-46页
        6.2.2 爬虫区间第46-47页
    6.3 检测实验第47-50页
        6.3.1 评价指标第47-48页
        6.3.2 验证实验第48页
        6.3.3 检测结果对比第48-49页
        6.3.4 实验小结第49-50页
    6.4 项目环境第50-51页
    6.5 本章小结第51-52页
第七章 总结与展望第52-53页
参考文献第53-56页
攻读硕士学位期间取得的研究成果第56-57页
致谢第57-58页
附件第58页

论文共58页,点击 下载论文
上一篇:基于软系统方法论的食物共享社区设计研究
下一篇:BIM与计算机视觉支持的室内铺装进度信息自动收集及可视化研究