首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop的web日志分析系统的研究与实现

摘要第4-6页
Abstract第6-7页
第1章 绪论第10-18页
    1.1 研究背景和选题意义第10-12页
        1.1.1 研究背景第10-11页
        1.1.2 选题意义第11-12页
    1.2 国内外研究现状第12-14页
    1.3 论文的主要内容第14-15页
    1.4 论文的组织结构第15-16页
    1.5 本章小结第16-18页
第2章 相关理论与技术第18-26页
    2.1 web日志挖掘第18-20页
    2.2 聚类算法第20-22页
    2.3 Hadoop分布式技术第22-25页
        2.3.1 HDFS文件系统第22-23页
        2.3.2 MapReduce计算框架第23-25页
    2.4 本章小结第25-26页
第3章 基于Hadoop的web日志分析系统的设计第26-40页
    3.1 系统总体设计第26-29页
    3.2 web日志预处理模块的设计第29-36页
        3.2.1 web日志格式说明第29-30页
        3.2.2 数据清洗第30页
        3.2.3 用户识别第30-31页
        3.2.4 会话识别第31页
        3.2.5 路径补充第31-32页
        3.2.6 事务识别第32-33页
        3.2.7 基于Hadoop的web日志预处理过程设计第33-36页
    3.3 web日志挖掘模块的设计第36-37页
    3.4 存储模块的设计第37-38页
    3.5 本章小结第38-40页
第4章 基于LTF-KM的分布式聚类算法第40-56页
    4.1 LGTS-FOA算法的提出第40-49页
        4.1.1 混沌映射理论第40-41页
        4.1.2 禁忌搜索思想第41-42页
        4.1.3 果蝇优化算法第42-44页
        4.1.4 LGTS-FOA算法思想第44-46页
        4.1.5 实验结果与分析第46-49页
    4.2 LTF-KM算法的提出第49-53页
        4.2.1 K-mediods算法第49-50页
        4.2.2 LTF-KM算法思想第50-51页
        4.2.3 实验结果与分析第51-53页
    4.3 基于LTF-KM的分布式聚类算法的提出第53-55页
        4.3.1 算法思想第54-55页
        4.3.2 算法流程第55页
    4.4 本章小结第55-56页
第5章 基于Hadoop的web日志分析系统的实现第56-76页
    5.1 系统总体实现第56-57页
    5.2 Hadoop分布式平台搭建第57-60页
    5.3 web日志预处理模块的实现第60-64页
        5.3.1 数据源的选取第60-61页
        5.3.2 数据清洗的实现第61页
        5.3.3 用户识别的实现第61-62页
        5.3.4 会话识别、路径补充和事务识别的实现第62-64页
    5.4 web日志挖掘模块的实现第64-69页
        5.4.1 基于主题访问频次的用户行为建模第64-66页
        5.4.2 基于LTF-KM的分布式聚类MapReduce实现第66-69页
    5.5 系统测试与结果分析第69-75页
        5.5.1 聚类质量对比实验第70-73页
        5.5.2 收敛速度对比实验第73-74页
        5.5.3 集群负载能力对比实验第74-75页
    5.6 本章小结第75-76页
结论第76-78页
参考文献第78-82页
攻读硕士学位期间发表的学术论文第82-84页
致谢第84页

论文共84页,点击 下载论文
上一篇:基于流量行为的协议逆向方法研究与实现
下一篇:SSL协议的研究以及基于TCM的优化