首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop的Web日志数据分析系统的研究

摘要第5-6页
ABSTRACT第6-7页
符号对照表第10-11页
缩略语对照表第11-15页
第一章 绪论第15-21页
    1.1 研究背景与研究意义第15-17页
        1.1.1 课题来源第15页
        1.1.2 研究背景第15-16页
        1.1.3 研究意义第16-17页
    1.2 国内外研究现状第17-19页
        1.2.1 Hadoop的研究现状第17-18页
        1.2.2 Web日志挖掘的研究现状第18-19页
    1.3 论文的主要内容和组织结构第19-21页
第二章 相关技术介绍第21-33页
    2.1 Hadoop第21-28页
        2.1.1 HBase第22-26页
        2.1.2 MapReduce第26-28页
    2.2 Web日志挖掘第28-30页
        2.2.1 Web日志的挖掘过程第28-29页
        2.2.2 Web日志的挖掘方法第29-30页
    2.3 Hadoop处理Web日志的优势第30-32页
    2.4 本章小结第32-33页
第三章 Web日志存储和优化的实现第33-45页
    3.1 Web日志结构分析第33-35页
    3.2 Web日志存储的实现第35-36页
    3.3 HBase的负载均衡算法的局限性第36-38页
        3.3.1 HBase的负载均衡算法的原理第36-38页
        3.3.2 HBase的负载均衡算法的弊端第38页
    3.4 基于负载因子组合排名的负载均衡优化算法第38-44页
        3.4.1 各负载因子的获得方式第38-39页
        3.4.2 RegionServer综合负载算法第39-41页
        3.4.3 Region综合负载算法第41-43页
        3.4.4 负载均衡优化算法的实现和验证第43-44页
    3.5 本章小结第44-45页
第四章 Web日志数据预处理的实现第45-57页
    4.1 Web日志预处理过程第45-49页
        4.1.1 数据清理第46页
        4.1.2 用户识别第46-47页
        4.1.3 会话识别第47-48页
        4.1.4 路径补充第48-49页
    4.2 基于Hadoop的Web日志预处理的设计第49-55页
        4.2.1 Hadoop集群下的数据清理第49-50页
        4.2.2 Hadoop集群下的用户识别第50-52页
        4.2.3 Hadoop集群下的会话识别第52-55页
    4.3 本章小结第55-57页
第五章 系统总体设计与实现第57-69页
    5.1 系统的整体框架第57-58页
        5.1.1 Web日志的存储模块第57-58页
        5.1.2 Web日志的预处理模块第58页
        5.1.3 Web日志的挖掘模块第58页
    5.2 Web日志的用户建模第58-59页
    5.3 Web日志聚类算法的设计第59-66页
        5.3.1 K-means算法的概述第59-61页
        5.3.2 ElkanK-means算法第61页
        5.3.3 基于初始中心点改进后的ElkanK-means算法第61-65页
        5.3.4 改进的K-means算法的并行化第65-66页
    5.4 Web日志聚类结果的具体分析第66-68页
        5.4.1 处理后的数据第66-67页
        5.4.2 改进的K-Means算法聚类分析第67-68页
    5.5 本章小结第68-69页
第六章 平台的实现与结果分析第69-79页
    6.1 系统运行环境的搭建与配置第69-73页
        6.1.1 Hadoop集群的搭建与部署第69页
        6.1.2 环境搭建与配置第69-73页
    6.2 系统运行结果分析第73-77页
        6.2.1 改进的负载均衡算法的优越性第73-75页
        6.2.2 改进的K-means算法的优越性第75-76页
        6.2.3 Hadoop分布式平台的高效性第76-77页
    6.3 本章小结第77-79页
第七章 总结与展望第79-81页
    7.1 总结第79-80页
    7.2 展望第80-81页
参考文献第81-83页
致谢第83-85页
作者简介第85-86页

论文共86页,点击 下载论文
上一篇:基于活动轮廓模型和水平集的图像分割方法研究
下一篇:基于多通道约束的图像解卷积方法研究