首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop的Web日志存储及预处理优化研究

摘要第5-6页
Abstract第6-7页
第1章 绪论第10-16页
    1.1 研究背景及意义第10-11页
    1.2 国内外研究现状第11-14页
        1.2.1 Hadoop研究现状第11-12页
        1.2.2 Web日志预处理研究概况第12-14页
    1.3 研究内容和组织结构第14-15页
    1.4 本章小结第15-16页
第2章 Hadoop技术第16-29页
    2.1 HBase第17-21页
        2.1.1 HBase体系结构第17-18页
        2.1.2 HBase逻辑视图第18-19页
        2.1.3 HBase物理存储第19-21页
    2.2 MapReduce第21-26页
        2.2.1 MapReduce计算模型第22-25页
        2.2.2 MapReduce工作原理第25-26页
    2.3 Hadoop处理Web日志的优势第26-27页
    2.4 本章小结第27-29页
第3章 Web日志数据在HBase中的存储及优化第29-37页
    3.1 Web日志概述第29-30页
    3.2 Web日志存储第30-32页
    3.3 Web日志存储性能优化第32-36页
        3.3.1 HBase负载均衡算法第32-34页
        3.3.2 基于子表限制的负载均衡优化算法第34-36页
    3.4 本章小结第36-37页
第4章 基于MapReduce的Web日志预处理第37-50页
    4.1 Web预处理第37-41页
        4.1.1 数据清理第37-38页
        4.1.2 用户识别第38-39页
        4.1.3 会话识别第39-40页
        4.1.4 路径补充第40-41页
    4.2 MapReduce框架下的Web日志预处理第41-48页
        4.2.1 数据清理第41-42页
        4.2.2 用户识别第42-43页
        4.2.3 会话识别第43-46页
        4.2.4 路径补充第46-48页
    4.3 本章小结第48-50页
第5章 实验及数据分析第50-62页
    5.1 实验环境的搭建与配置第50-55页
        5.1.1 实验环境搭建第50-51页
        5.1.2 集群环境配置第51-55页
    5.2 HBase负载均衡优化实验第55-57页
    5.3 基于Hadoop的Web日志预处理实验第57-60页
        5.3.1 Hadoop对Web日志预处理的高效性第57-59页
        5.3.2 MapReduce处理优化后预处理算法的有效性第59-60页
    5.4 本章小结第60-62页
结论第62-64页
致谢第64-65页
参考文献第65-69页
作者简介第69页
攻读硕士期间发表论文和参加科研情况说明第69-70页

论文共70页,点击 下载论文
上一篇:自吸离散式数字PCR芯片检测装置的关键技术研究与系统开发
下一篇:面向网络舆情的文本语义倾向性分类算法研究