首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--自动化系统论文--数据处理、数据处理系统论文

基于集群计算的网络信息采集系统的设计与实现

摘要第4-5页
Abstract第5页
第1章 绪论第8-14页
    1.1 课题研究背景及意义第8-9页
    1.2 网络信息采集研究现状第9-10页
    1.3 课题研究内容第10-12页
        1.3.1 Web 网页信息采集研究第11-12页
        1.3.2 双语网站信息采集研究第12页
    1.4 内容组织结构第12-14页
第2章 网络信息采集的相关技术第14-27页
    2.1 分布式集群 HADOOP 相关知识第14-18页
        2.1.1 HDFS 简介第15-16页
        2.1.2 MapReduce 计算模型简介第16-18页
    2.2 URLS 调度策略第18-20页
    2.3 URLS 去重方案第20-21页
    2.4 网页更新概率计算第21-24页
    2.5 网页更新识别方式第24页
    2.6 DNS 分布式缓存第24-25页
    2.7 其他相关问题第25-26页
    2.8 本章小结第26-27页
第3章 网络信息采集系统第27-54页
    3.1 网络信息采集系统的 MAPREDUCE 处理流程第27-28页
    3.2 WEB 网页信息采集系统的设计与实现第28-38页
        3.2.1 系统设计目标第28页
        3.2.2 系统总体结构第28-30页
        3.2.3 格式化功能模块设计与实现第30-32页
        3.2.4 下载功能模块设计与实现第32-35页
        3.2.5 URLs 去重功能模块设计与实现第35-37页
        3.2.6 网页去重功能模块设计与实现第37-38页
    3.3 面向双语网站的网页信息采集系统的设计与实现第38-53页
        3.3.1 系统设计目标第38-39页
        3.3.2 系统总体结构第39-41页
        3.3.3 格式化功能模块设计与实现第41-44页
        3.3.4 双语站内下载模块设计与实现第44-46页
        3.3.5 URLs 去重功能模块设计与实现第46-49页
        3.3.6 网页更新下载功能模块设计与实现第49-51页
        3.3.7 网页去重功能模块设计与实现第51-53页
    3.4 本章小结第53-54页
第4章 网络信息采集系统评测第54-59页
    4.1 系统评测第54-58页
        4.1.1 网络信息采集系统运行环境第54页
        4.1.2 Web 网页信息采集系统评测第54-56页
        4.1.3 双语网站信息更新采集系统评测第56-58页
    4.2 本章小结第58-59页
结论第59-61页
参考文献第61-65页
致谢第65页

论文共65页,点击 下载论文
上一篇:基于气动肌肉的类“豹”型机器人后肢设计
下一篇:基于社会媒体的社交圈识别研究