首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop的电商数据分析系统的设计与实现

摘要第3-5页
Abstract第5-6页
第1章 绪论第10-17页
    1.1 论文设计的背景及意义第10-12页
    1.2 国内外的研究应用现状第12-15页
        1.2.1 研究应用范围第12-14页
        1.2.2 国内外的应用现状第14-15页
    1.3 论文主要内容第15-16页
    1.4 论文组织结构第16-17页
第2章 相关技术分析第17-23页
    2.1 HDFS分布式文件系统第17-18页
    2.2 MapReduce编程模型第18-19页
        2.2.1 MapReduce原理第18-19页
        2.2.2 MapReduce处理过程第19页
    2.3 YARN的原理第19-20页
        2.3.1 YARN基本架构第19页
        2.3.2 YARN基本组成结构第19-20页
    2.4 Hadoop生态圈组件第20-22页
    2.5 机器学习-Mahout第22页
    2.6 本章小结第22-23页
第3章 系统的需求分析与设计第23-33页
    3.1 需求分析第23-25页
        3.1.1 功能需求分析第23-24页
        3.1.2 非功能需求分析第24-25页
        3.1.3 系统业务流程分析第25页
    3.2 电商数据分析系统的设计第25-32页
        3.2.1 系统架构设计第25-26页
        3.2.2 功能模块设计第26-27页
        3.2.3 数据收集设计第27-28页
        3.2.4 数据处理设计第28-29页
        3.2.5 数据分析设计第29页
        3.2.6 数据库表结构设计第29-32页
    3.3 本章小结第32-33页
第4章 电商分析系统的实现第33-49页
    4.1 系统开发环境第33页
    4.2 数据收集模块的实现第33-37页
        4.2.1 收集事件第34-35页
        4.2.2 Nginx和Flume的配置第35-36页
        4.2.3 爬虫框架及运行流程第36-37页
    4.3 数据分析模块的实现第37-42页
        4.3.1 数据清洗模块第37-39页
        4.3.2 用户基本信息分析第39-42页
    4.4 数据展示模块的实现第42-43页
    4.5 平台监控模块的实现第43-45页
    4.6 日志文件分析的实现第45-48页
    4.7 本章小结第48-49页
第5章 商品评论数据分析第49-62页
    5.1 商品评论的数据分析挖掘目标第49页
    5.2 商品评论的数据分析流程第49-50页
    5.3 商品评论的数据采集与预处理第50-51页
    5.4 商品评论的数据分析与可视化第51-56页
    5.5 商品评论数据的情感分析第56-60页
        5.5.1 意见挖掘的层次和类型第56-57页
        5.5.2 评论数据的来源第57页
        5.5.3 情感分析方法第57-59页
        5.5.4 基于分词法和评分方法的情感分析第59-60页
    5.6 本章小结第60-62页
第6章 用户推荐的分析与实现第62-69页
    6.1 推荐工具的研究与分析第62-64页
    6.2 混合推荐算法第64-68页
        6.2.1 改进的K-means聚类算法描述第64-65页
        6.2.2 协同过滤和聚类的混合合推荐算法第65-68页
    6.3 本章小结第68-69页
第7章 系统测试第69-75页
    7.1 测试环境第69页
    7.2 功能测试第69-74页
        7.2.1 登录测试第69-70页
        7.2.2 数据采集功能测试第70-71页
        7.2.3 数据转存功能测试第71-72页
        7.2.4 用户推荐测试第72-74页
    7.3 本章小结第74-75页
第8章 总结与展望第75-77页
    8.1 总结第75-76页
    8.2 展望第76-77页
参考文献第77-79页
附录一第79-81页
附录二第81-82页
致谢第82-83页

论文共83页,点击 下载论文
上一篇:MOOC教师教学性存在的研究:中外合作混合教学的视角
下一篇:利用PF-Ring零拷贝优化Spark Streaming网络性能