首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop的基础教育资源的存储和处理

摘要第4-5页
Abstract第5-6页
第1章 绪论第9-17页
    1.1 研究背景和意义第9-10页
    1.2 国内外研究现状第10-14页
        1.2.1 基础教育资源存储的研究现状第10-11页
        1.2.2 基础教育资源处理的研究现状第11-14页
    1.3 论文主要内容和结构第14-17页
第2章 基础教育资源数据获取第17-29页
    2.1 互联网上基础教育资源特点第17-18页
    2.2 基于Scrapy的分布式爬虫实现第18-28页
        2.2.1 网络爬虫基本原理第19-20页
        2.2.2 基于Scrapy的爬虫设计第20-24页
        2.2.3 基于Scrapy的分布式爬虫设计第24-26页
        2.2.4 实验与分析第26-28页
    2.3 本章小结第28-29页
第3章 基础教育资源数据存储第29-38页
    3.1 基于HDFS的资源文件的存储第29-37页
        3.1.1 HDFS存在问题分析第30-31页
        3.1.2 基础教育资源文件的存储方案第31-34页
        3.1.3 实验与分析第34-37页
    3.2 本章小结第37-38页
第4章 基础教育资源数据处理第38-60页
    4.1 基于行块分布函数的网页正文提取算法改进第38-51页
        4.1.1 行块分布函数的网页正文提取算法的问题分析第38-43页
        4.1.2 行块分布函数的网页正文提取算法改进第43-48页
        4.1.3 实验及分析第48-51页
    4.2 基于MapReduce的网页正文提取第51-58页
        4.2.1 MapReduce的优化分析第51-53页
        4.2.2 基于MapReduce的优化策略第53-57页
        4.2.3 实验与分析第57-58页
    4.3 本章小结第58-60页
第5章 研究总结与展望第60-63页
    5.1 总结第60-61页
    5.2 展望第61-63页
致谢第63-64页
参考文献第64-67页
研究生期间的工作成果第67页

论文共67页,点击 下载论文
上一篇:基于SaaS的商品溯源平台的研究与实现
下一篇:基于应变测量的无线同步采集系统的实现