首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop的Web日志存储和分析系统的研究与实现

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第10-16页
    1.1 研究背景第10-11页
    1.2 研究现状第11-13页
    1.3 本文主要工作第13页
    1.4 论文的组织结构第13-16页
第二章 相关技术第16-24页
    2.1 分布式文件存储系统第16页
    2.2 HDFS架构介绍第16-20页
    2.3 Web日志挖掘第20-22页
        2.3.1 Web日志挖掘概述第20页
        2.3.2 Web日志聚类算法第20-21页
        2.3.3 关联规则挖掘算法第21-22页
    2.4 Spark分布式计算框架第22页
    2.5 本章小结第22-24页
第三章 基于任务队列的HDFS小文件异步存储方案第24-34页
    3.1 HDFS小文件存储分析第24-25页
    3.2 存储框架的设计思想第25-27页
        3.2.1 基于任务队列合并方案的设计思想第25-26页
        3.2.2 基于Hash索引预取策略的设计思想第26页
        3.2.3 存储框架整体设计第26-27页
    3.3 存储框架的具体实现第27-30页
        3.3.1 合并算法的实现第27-28页
        3.3.2 索引与预取策略的实现第28-30页
    3.4 实验以及数据对比分析第30-33页
        3.4.1 实验环境第30-31页
        3.4.2 小文件上传和下载对比实验第31-32页
        3.4.3 名称节点内存消耗实验第32-33页
    3.5 本章小结第33-34页
第四章 聚类算法优化及其在Web日志关联规则挖掘的应用第34-50页
    4.1 K-means聚类算法的优化第34-38页
        4.1.1 K-means算法的分析第34-36页
        4.1.2 K-means算法的优化第36-37页
        4.1.3 K-means优化算法的适用性分析第37-38页
    4.2 基于优化聚类算法的FP-Growth关联规则挖掘方案实现第38-42页
        4.2.1 FP-Growth算法的执行步骤第38-40页
        4.2.2 方案实现第40-42页
    4.3 实验及结果分析第42-48页
        4.3.1 实验环境及数据来源第42页
        4.3.2 K-means聚类分析第42-44页
        4.3.3 实验过程及结果分析第44-48页
    4.4 本章小结第48-50页
第五章 Web日志存储和分析系统的实现第50-64页
    5.1 需求分析第50-51页
    5.2 系统设计第51-54页
        5.2.1 系统功能设计第51页
        5.2.2 数据库设计第51-54页
        5.2.3 系统整体框架设计第54页
    5.3 系统实现第54-62页
        5.3.1 MVC框架搭建第54-56页
        5.3.2 系统功能模块实现第56-58页
        5.3.3 系统展示第58-62页
        5.3.4 结果分析第62页
    5.4 本章小结第62-64页
第六章 总结和展望第64-66页
    6.1 总结第64-65页
    6.2 展望第65-66页
参考文献第66-70页
致谢第70-72页
攻读学位期间发表的学术论文第72页

论文共72页,点击 下载论文
上一篇:网络设备信息安全评估方法研究
下一篇:空间信息网络的入侵检测技术研究