首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Spark平台的公交用户数据分析

摘要第3-5页
ABSTRACT第5-6页
第一章 绪论第12-17页
    1.1 研究背景第12-13页
    1.2 研究目的及意义第13页
    1.3 研究现状及进展第13-14页
    1.4 研究内容第14-15页
    1.5 论文结构安排第15-17页
第二章 理论基础第17-25页
    2.1 用户行为的定义和分类第17页
        2.1.1 用户行为的定义第17页
        2.1.2 用户行为的分类第17页
    2.2 用户行为分析方法第17-18页
        2.2.1 聚类分析第18页
        2.2.2 关联分析第18页
    2.3 聚类分析第18-22页
        2.3.1 聚类的定义第18页
        2.3.2 聚类的要求第18-19页
        2.3.3 聚类方法的类别第19-20页
        2.3.4 常见聚类算法第20-21页
        2.3.5 聚类算法的选取第21-22页
    2.4 关联分析第22页
    2.5 Spark组件第22-24页
        2.5.1 SparkCore第23页
        2.5.2 SparkSQL第23-24页
        2.5.3 MLlib第24页
    2.6 本章小结第24-25页
第三章 公交用户数据分析算法设计第25-35页
    3.1 数据处理工具的选取第25页
    3.2 数据预处理第25-27页
        3.2.1 数据预处理过程第26页
        3.2.2 数据预处理结果第26-27页
    3.3 基于FP-Growth模型的用户数据关联规则分析算法设计第27-28页
    3.4 用户时间行为分析算法设计第28-31页
        3.4.1 用户访问时间第29-30页
        3.4.2 模块平均访问时间第30页
        3.4.3 时间偏好模式第30-31页
    3.5 用户兴趣行为分析算法设计第31-34页
        3.5.1 各模块访问人次第31-32页
        3.5.2 兴趣偏好模式第32-34页
    3.6 本章小结第34-35页
第四章 公交用户数据挖掘算法实验与结果分析第35-49页
    4.1 基于FP-Growth模型的用户数据关联规则分析第35-36页
        4.1.1 挖掘结果第35-36页
        4.1.2 结果分布第36页
    4.2 用户时间行为分析第36-43页
        4.2.1 用户访问时间分析第37-38页
        4.2.2 模块平均访问时间分析第38-39页
        4.2.3 类簇个数K值的选择第39-40页
        4.2.4 基于K-Means聚类的用户时间偏好模式分析第40-41页
        4.2.5 基于神经网络聚类的用户时间偏好模式分析第41-42页
        4.2.6 两种聚类模型对比实验分析第42-43页
    4.3 用户兴趣行为分析第43-48页
        4.3.1 各模块访问人次分析第43-44页
        4.3.2 类簇个数K值的选择第44-45页
        4.3.3 基于K-Means聚类的用户兴趣偏好模式分析第45-46页
        4.3.4 基于神经网络聚类的用户兴趣偏好模式分析第46-47页
        4.3.5 两种聚类模型对比实验分析第47-48页
    4.4 本章小结第48-49页
第五章 总结与展望第49-51页
    5.1 总结第49页
    5.2 展望第49-51页
附录第51-52页
致谢第52-53页
参考文献第53-56页

论文共56页,点击 下载论文
上一篇:基于信息熵的管道泄漏检测研究
下一篇:1060铝软钎焊用Sn基钎料合金的研究