首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Storm的Web日志分析系统的设计与实现

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第11-16页
    1.1 研究背景及意义第11-12页
    1.2 国内外研究现状第12-14页
    1.3 研究目标及内容第14-15页
    1.4 论文结构第15-16页
第二章 相关技术综述第16-30页
    2.1 Web日志研究概述第16-17页
    2.2 大数据计算工具Storm第17-23页
        2.2.1 Storm的基本架构第17-18页
        2.2.2 Storm核心概念第18-20页
        2.2.3 Storm的可靠性第20页
        2.2.4 Storm的技术处理模型第20-21页
        2.2.5 Storm的高级抽象Trident和Trident-ML第21-23页
            2.2.5.1 Trident第21-22页
            2.2.5.2 Trident-ML第22-23页
    2.3 其他相关分布式技术介绍第23-27页
        2.3.1 海量日志收集系统Flume第23-24页
        2.3.2 分布式服务协调系统Zookeeper第24-25页
        2.3.3 分布式消息发布-订阅系统Kafka第25-26页
        2.3.4 分布式监控系统Ganglia第26-27页
    2.4 K-means++算法概述第27-29页
    2.5 本章小结第29-30页
第三章 系统需求分析和架构实现第30-40页
    3.1 系统需求分析第30-31页
    3.2 系统架构设计第31-37页
        3.2.1 日志收集模块第32-33页
        3.2.2 日志缓存模块第33-34页
        3.2.3 日志计算模块第34-36页
        3.2.4 结果存储模块第36页
        3.2.5 结果展示模块第36页
        3.2.6 系统监控模块第36-37页
    3.3 用户聚类的技术实现分析第37-39页
        3.3.1 K-means++的实现原语Trident第37页
        3.3.2 Web日志信息的特征抽象第37-38页
        3.3.3 K-means++在Trident-ML上的执行流程分析第38-39页
    3.4 本章小结第39-40页
第四章 系统平台搭建与结果分析第40-67页
    4.1 系统平台搭建第40-49页
        4.1.1 实验环境准备第40-41页
        4.1.2 日志预处理与实时日志生成第41页
        4.1.3 各模块的配置与整合第41-49页
    4.2 Storm实时计算的流程设计与代码实现第49-60页
        4.2.1 Storm实时计算的流程设计第49-50页
        4.2.2 Storm实时计算的代码实现第50-60页
            4.2.2.1 Topology的构建与任务提交第50-52页
            4.2.2.2 日志过滤Bolt的实现第52页
            4.2.2.3 统计分析Bolt的实现第52-58页
            4.2.2.4 TridentTopology的构建与任务提交第58-60页
            4.2.2.5 用户聚类在Trident-ML上的实现第60页
    4.3 系统功能测试与结果分析第60-66页
        4.3.1 统计结果的展示与分析第61-63页
        4.3.2 用户聚类结果的展示与分析第63-66页
    4.4 本章小结第66-67页
第五章 系统的性能优化研究第67-72页
    5.1 Storm配置对系统性能的影响第67-69页
        5.1.1 不同并发度对系统性能的影响第68页
        5.1.2 不同Spout pending值对系统性能的影响第68-69页
    5.2 系统性能的优化方向第69-70页
    5.3 本章小结第70-72页
第六章 总结与展望第72-74页
    6.1 论文工作总结第72页
    6.2 不足与展望第72-74页
参考文献第74-77页
致谢第77页

论文共77页,点击 下载论文
上一篇:社交网络表征算法研究
下一篇:NFV中服务链资源分配