首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

一种高性能网络爬虫系统关键技术研究

摘要第5-6页
abstract第6-7页
第1章 绪论第10-14页
    1.1 课题研究背景及意义第10-11页
    1.2 课题研究内容第11-12页
    1.3 论文组织结构第12-14页
第2章 相关理论研究及国内外研究现状第14-22页
    2.1 引言第14页
    2.2 网络爬虫介绍第14页
    2.3 网络爬虫目标链接提取技术研究现状第14-18页
        2.3.1 待爬链接去重第15-16页
        2.3.2 相关链接提取第16-18页
    2.4 网络爬虫业务数据缓存技术研究现状第18-21页
        2.4.1 网页数据缓存第18-20页
        2.4.2 DNS缓存第20-21页
    2.5 本章小结第21-22页
第3章 网络爬虫目标链接提取技术研究第22-42页
    3.1 引言第22页
    3.2 基于布隆过滤器的非重复链接提取模型第22-28页
        3.2.1 经典布隆过滤器模型第22-25页
        3.2.2 基于链接特征的多级动态布隆过滤器第25-28页
    3.3 一种基于链接属性的相关链接提取算法第28-33页
        3.3.1 相关链接提取算法分析第28-29页
        3.3.2 基于链接属性的相关链接提取算法第29-33页
    3.4 实验结果与分析第33-40页
        3.4.1 实验方案第33-34页
        3.4.2 实验结果第34-40页
    3.5 本章小结第40-42页
第4章 网络爬虫业务数据缓存技术研究第42-60页
    4.1 引言第42页
    4.2 一种网页数据缓存管理优化模型第42-49页
        4.2.1 内存管理模型第42-45页
        4.2.2 网页数据缓存管理优化模型第45-49页
    4.3 一种基于预解析及分组哈希的DNS缓存策略第49-54页
        4.3.1 常用DNS缓存技术第49-51页
        4.3.2 基于预解析及分组哈希的DNS缓存策略第51-54页
    4.4 实验结果与分析第54-59页
        4.4.1 实验方案第54-55页
        4.4.2 实验结果第55-59页
    4.5 本章小结第59-60页
第5章 一种高性能网络爬虫系统的设计与实现第60-68页
    5.1 引言第60页
    5.2 系统设计目标第60页
    5.3 系统总体设计第60-63页
        5.3.1 系统模块划分第60-61页
        5.3.2 系统工作流程第61-63页
    5.4 系统具体实现第63-66页
    5.5 系统功能与性能测试第66-67页
        5.5.1 系统功能测试第66页
        5.5.2 系统性能测试第66-67页
    5.6 本章小结第67-68页
结论第68-70页
参考文献第70-73页
攻读硕士学位期间发表的论文和取得的科研成果第73-74页
致谢第74页

论文共74页,点击 下载论文
上一篇:基于入侵行为的未知反序列化漏洞检测系统
下一篇:基于AMF的分层处理算法及其软件实现