首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于SPARK的用户特征分析

学位论文的主要创新点第3-4页
摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第9-13页
    1.1 研究背景第9-10页
    1.2 选题意义第10页
    1.3 国内外研究现状第10-11页
        1.3.1 国内研究状况第10-11页
        1.3.2 国际研究状况第11页
    1.4 本文的主要工作第11页
    1.5 本文的组织结构第11-13页
第二章 相关技术研究第13-31页
    2.1 贝叶斯定理第13-14页
    2.2 朴素贝叶斯分类算法第14-17页
        2.2.1 朴素贝叶斯分类算法的概念第14-15页
        2.2.2 朴素贝叶斯分类算法的特点第15-17页
    2.3 Spark计算平台相关技术第17-23页
        2.3.1 Spark的介绍第17-19页
        2.3.2 Spark驱动节点和执行节点第19页
        2.3.3 RDD弹性分布式数据集第19-22页
        2.3.4 Spark on Yarn第22-23页
    2.4 HDFS第23-29页
        2.4.1 HDFS架构第23-26页
        2.4.2 HDFS文件解析第26-29页
        2.4.3 HDFS安全模式第29页
    2.5 本章小结第29-31页
第三章 用户特征分析系统设计第31-41页
    3.1 实验环境第31页
    3.2 用户特征分类第31页
    3.3 用户数据第31-35页
        3.3.1 数据获取第31-32页
        3.3.2 数据预处理第32-34页
        3.3.3 数据向量化第34-35页
    3.4 用户特征权重第35-37页
        3.4.1 TF-IDF权重第35-36页
        3.4.2 TFC-IDFC权重第36-37页
    3.5 系统整体架构第37-38页
    3.6 实验结果评价标准第38-39页
    3.7 本章小结第39-41页
第四章 基于Spark的用户特征分析实现第41-57页
    4.1 Spark平台搭建第41-44页
    4.2 数据降维第44-45页
    4.3 基于朴素贝叶斯的用户分类分析第45-48页
        4.3.1 基本分类过程第45-46页
        4.3.2 基本算法实现第46-47页
        4.3.3 基本算法的分类结果第47-48页
    4.4 基于TF-IDF权重的分类分析第48-51页
        4.4.1 基于TF-IDF权重的分类过程第48-49页
        4.4.2 基于TF-IDF权重的算法实现第49-50页
        4.4.3 基于TF-IDF权重的分类结果第50-51页
    4.5 基于改进的TFC-IDFC权重的分类分析第51-54页
        4.5.1 基于TFC-IDFC权重的分类过程第51页
        4.5.2 基于TFC-IDFC权重的算法实现第51-53页
        4.5.3 基于TFC-IDFC权重的分类结果第53-54页
    4.6 实验结果分析第54-55页
    4.7 本章小结第55-57页
第五章 总结与展望第57-59页
    5.1 总结第57页
    5.2 展望第57-59页
参考文献第59-65页
发表论文和参加科研情况第65-67页
致谢第67页

论文共67页,点击 下载论文
上一篇:论吴冠中绘画美学思想的实践性品格
下一篇:浅析翦伯赞的史学思想