首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Spark的航空常旅客流失模型研究与实现

摘要第5-6页
Abstract第6页
第一章 绪论第9-13页
    1.1 研究背景及意义第9页
    1.2 国内外研究现状第9-10页
    1.3 研究内容和主要工作第10-11页
    1.4 论文组织结构第11-13页
第二章 相关理论与技术分析第13-26页
    2.1 Spark并行计算框架第13-18页
        2.1.1 Spark运行时架构第14-15页
        2.1.2 弹性分布式数据集RDD第15-17页
        2.1.3 Spark与Hadoop MapReduce的对比第17-18页
    2.2 分类机器学习算法第18-22页
        2.2.1 决策树第18-20页
        2.2.2 随机森林第20-21页
        2.2.3 梯度提升树第21-22页
    2.3 报表展示技术第22-25页
    2.4 本章小结第25-26页
第三章 南航常旅客流失模型分析与设计第26-42页
    3.1 流失模型需求分析第26-28页
        3.1.1 时间窗口定义第26-27页
        3.1.2 常旅客流失定义第27-28页
    3.2 算法模型设计第28-34页
        3.2.1 特征设计第28-30页
        3.2.2 单模型算法过程设计第30-31页
        3.2.3 模型融合算法设计第31-34页
        3.2.4 聚类算法设计第34页
    3.3 展示系统设计第34-41页
        3.3.1 功能需求分析第34-37页
        3.3.2 展示系统总体设计第37-39页
        3.3.3 数据库设计第39-40页
        3.3.4 界面设计第40-41页
    3.4 本章小结第41-42页
第四章 基于Spark的模型实现第42-63页
    4.1 数据预处理及特征工程第42-49页
        4.1.1 数据预处理第43-44页
        4.1.2 基于Spark的特征提取与标签标识第44-47页
        4.1.3 基于Spark的特征处理与选择第47-49页
    4.2 MLlib模型训练及评测第49-57页
        4.2.1 逻辑回归第49-53页
        4.2.2 随机森林第53-55页
        4.2.3 梯度提升树第55-57页
    4.3 Stacking模型融合第57-59页
    4.4 模型结果对比分析第59-60页
    4.5 聚类分析实现第60-62页
    4.6 本章小结第62-63页
第五章 存储与展示系统的实现第63-72页
    5.1 数据存储的实现第63-64页
        5.1.1 数据库存储第63-64页
        5.1.2 HDFS文本存储第64页
    5.2 数据展示的实现第64-71页
        5.2.1 集成目录与配置第64-66页
        5.2.2 模板与数据源第66-68页
        5.2.3 报表解析第68-69页
        5.2.4 报表导出第69-71页
    5.3 本章小结第71-72页
第六章 系统测试与结果分析第72-86页
    6.1 系统测试环境介绍第72-75页
        6.1.1 测试环境第72-73页
        6.1.2 离线模型平台搭建第73-75页
    6.2 系统测试方案设计第75-76页
    6.3 系统测试过程及结果分析第76-85页
        6.3.1 离线模型测试第76-79页
        6.3.2 展示系统功能测试第79-85页
    6.4 本章小结第85-86页
总结与展望第86-87页
参考文献第87-90页
攻读硕士学位期间取得的研究成果第90-91页
致谢第91-92页
附件第92页

论文共92页,点击 下载论文
上一篇:基于机器视觉的PCB元器件在线检测
下一篇:服务设计理念指导下的影视城app设计研究--以横店影视城为例