首页--经济论文--贸易经济论文--中国国内贸易经济论文--商品流通论文--电子贸易、网上贸易论文

基于Hadoop平台的增利宝数据分析与应用

摘要第5-6页
Abstract第6页
第一章 绪论第9-12页
    1.1 选题背景与研究意义第9页
    1.2 相关技术的发展第9-10页
        1.2.1 Hadoop发展现状第9-10页
        1.2.2 聚类算法的发展现状第10页
    1.3 本文内容及组织架构第10-12页
第二章 相关技术介绍第12-22页
    2.1 Hadoop生态圈第12-13页
    2.2 分布式文件存储系统HDFS第13-16页
        2.2.1 HDFS设计特点第13-14页
        2.2.2 NameNode和DataNode第14-15页
        2.2.3 HDFS的读取第15-16页
    2.3 分布式计算模型MapReduce第16-18页
        2.3.1 Map第17页
        2.3.2 Reduce第17-18页
    2.4 分布式数据仓库Hive第18-20页
        2.4.1 Hive简介第18-19页
        2.4.2 Hive的数据存储第19页
        2.4.3 Hive表第19-20页
    2.5 分布式协调服务Zookeeper第20-22页
第三章 基于Hadoop平台的增利宝数据分析方法改进第22-34页
    3.1 项目背景与分析意义第22-23页
    3.2 传统数据分析方法介绍第23-24页
    3.3 基于Hadoop平台的数据分析优势第24页
    3.4 基于Hadoop平台的K-means算法改进第24-34页
        3.4.1 选取K-means算法的理由第24-25页
        3.4.2 K-means算法介绍第25-26页
        3.4.3 K-means算法存在的问题第26-28页
        3.4.4 K-means算法改进思想第28-30页
        3.4.5 改进算法部分计算流程说明第30-32页
        3.4.6 K-means算法MapReduce实现第32-34页
第四章 Hadoop技术及K-means算法在增利宝数据分析中的应用第34-53页
    4.1 Hadoop集群搭建第34-40页
        4.1.1 集群规划第34-35页
        4.1.2 SSH配置第35页
        4.1.3 ZooKeeper搭建第35-37页
        4.1.4 Hadoop平台搭建第37-38页
        4.1.5 Hive搭建第38-40页
    4.2 增利宝客户价值介绍第40-43页
        4.2.1 客户价值定义第42页
        4.2.2 客户价值计算第42-43页
        4.2.3 客户价值分析意义第43页
    4.3 基于Hadoop平台的客户价值多属性交叉分析第43-45页
        4.3.1 客户价值与年龄交叉分析第44页
        4.3.2 客户价值与地区交叉分析第44-45页
    4.4 基于Hadoop平台的客户价值聚类分析第45-51页
        4.4.1 聚类分析过程及结果第45-48页
        4.4.2 聚类结果分析第48-51页
    4.5 不同数据量测试及结果分析第51-53页
第五章 总结与展望第53-54页
参考文献第54-56页
攻读硕士学位期间发表的论文及参与的项目第56-58页
致谢第58页

论文共58页,点击 下载论文
上一篇:基于主题聚类的Web资源个性化推荐方法
下一篇:基于多层框架的数字校园毕业生离校管理系统的设计