首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于Hadoop的日志统计分析系统的设计与实现

摘要第4-5页
Abstract第5-6页
目录第7-10页
第1章 绪论第10-16页
    1.1 课题来源及研究意义第10页
    1.2 与本课题相关的国内外研究状况第10-14页
        1.2.1 Hadoop 应用的国外研究状况第10-12页
        1.2.2 Hadoop 应用的国内研究状况第12-13页
        1.2.3 Hadoop 日志统计分析系统的相关技术第13-14页
    1.3 本课题研究的主要内容第14-15页
    1.4 本文组织结构第15-16页
第2章 日志统计分析系统需求及相关技术第16-25页
    2.1 基于 Hadoop 的日志统计分析系统的需求第16-20页
        2.1.1 集群环境部署需求第16-17页
        2.1.2 日志同步功能的需求第17页
        2.1.3 统计分析作业定制需求第17-19页
        2.1.4 统计分析任务调度需求第19页
        2.1.5 海量数据的查询需求第19-20页
        2.1.6 非功能需求第20页
    2.2 日志统计分析系统的相关技术第20-24页
        2.2.1 Hadoop 日志统计分析系统的架构技术第20-22页
        2.2.2 前端框架技术第22页
        2.2.3 Web 开发框架技术第22-23页
        2.2.4 任务调度第23-24页
    2.3 本章小结第24-25页
第3章 日志统计分析系统的设计第25-49页
    3.1 Hadoop 分析大数据设计要解决的问题第25-26页
    3.2 日志统计分析系统的结构设计第26-28页
        3.2.1 日志统计分析系统的功能结构第26-27页
        3.2.2 日志统计分析系统的体系架构第27-28页
    3.3 日志统计分析系统的数据流程第28-29页
    3.4 集群环境部署设计第29-32页
        3.4.1 硬件规划第29-32页
        3.4.2 软件规划第32页
    3.5 日志同步模块的设计第32-37页
        3.5.1 文本日志同步第33-35页
        3.5.2 格式化数据同步第35-36页
        3.5.3 准实时数据同步第36页
        3.5.4 数据可靠性校验第36-37页
    3.6 统计分析作业定制模块的设计第37-42页
        3.6.1 MapReduce 作业的定制第37-40页
        3.6.2 Streaming 作业定制第40-41页
        3.6.3 Hive 分析作业定制第41-42页
        3.6.4 作业在线测试第42页
    3.7 统计分析任务调度模块的设计第42-46页
        3.7.1 提交调度设计第43-45页
        3.7.2 运行调度设计第45-46页
    3.8 数据查询模块的设计第46-48页
        3.8.1 HBase 数据查询设计第46-48页
        3.8.2 HDFS 数据查询设计第48页
    3.9 本章小结第48-49页
第4章 基于 Hadoop 的日志统计分析系统的实现第49-81页
    4.1 集群环境的部署第49-52页
        4.1.1 Hadoop 集群部署第49-50页
        4.1.2 HBase 集群部署第50-52页
    4.2 日志同步模块的实现第52-57页
        4.2.1 创建和配置数据源第52-53页
        4.2.2 文本日志同步实现第53-56页
        4.2.3 格式化数据同步实现第56页
        4.2.4 准实时数据同步实现第56-57页
        4.2.5 数据可靠性校验实现第57页
    4.3 统计分析作业定制模块的实现第57-67页
        4.3.1 MapReduce 作业的定制的实现第57-63页
        4.3.2 Streaming 作业定制的实现第63-64页
        4.3.3 Hive 分析作业定制的实现第64-66页
        4.3.4 作业在线测试的实现第66-67页
    4.4 统计分析任务调度模块的实现第67-72页
        4.4.1 提交调度的实现第67-70页
        4.4.2 执行调度的实现第70-72页
    4.5 数据查询模块的实现第72-80页
        4.5.1 HBase 数据查询实现第72-77页
        4.5.2 HDFS 数据查询实现第77-80页
    4.6 本章小结第80-81页
第5章 基于 Hadoop 的日志统计分析系统的的测试第81-97页
    5.1 Hadoop 系统的测试介绍第81-84页
        5.1.1 Hadoop 程序常见问题和测试方法第81-83页
        5.1.2 Hadoop 常用测试工具第83-84页
    5.2 功能测试第84-91页
        5.2.1 日志同步功能测试第84-87页
        5.2.2 统计分析作业定制功能测试第87-89页
        5.2.3 统计分析任务调度功能测试第89-90页
        5.2.4 统计分析结果查询功能测试第90-91页
    5.3 MapReduce 程序测试第91-92页
    5.4 性能测试第92-95页
        5.4.1 HDFS 性能测试第92-94页
        5.4.2 MapReduce 性能测试第94-95页
    5.5 结果分析第95-96页
    5.6 本章小结第96-97页
结论第97-98页
参考文献第98-102页
致谢第102-103页
个人简历第103页

论文共103页,点击 下载论文
上一篇:BmCPV感染家蚕中肠组织转录组的比较研究及BmCPV片段1中假定重叠基因的鉴定
下一篇:基于ZigBee的无线智能家居控制系统研究