首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于spark平台的数据填充技术研究与实现

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第9-15页
    1.1 选题背景与研究意义第9-11页
        1.1.1 研究背景第9-10页
        1.1.2 研究意义第10-11页
    1.2 数据清洗研究现状第11-12页
    1.3 分布式计算研究现状第12-13页
    1.4 研究内容和章节结构第13-15页
        1.4.1 主要研究内容第13-14页
        1.4.2 论文章节结构第14-15页
第二章 相关技术分析第15-23页
    2.1 数据清洗技术第15-17页
        2.1.1 数据质量问题分类第15-16页
        2.1.2 数据质量检验标准第16-17页
    2.2 Spark平台介绍第17-22页
        2.2.1 Spark平台组成第17-18页
        2.2.2 应用提交逻辑第18-19页
        2.2.3 RDD原理介绍第19-22页
    2.3 本章小结第22-23页
第三章 基于Apriori的数据填充算法第23-37页
    3.1 空缺值清洗研究第23-24页
    3.2 关联规则关键指标第24-26页
    3.3 改进型规则提取流程第26-31页
        3.3.1 数据预处理第26-28页
        3.3.2 构建属性映射表第28-29页
        3.3.3 项集增长与剪枝策略第29-30页
        3.3.4 最大置信度规则选取策略第30-31页
    3.4 算法步骤第31-33页
    3.5 仿真实验第33-36页
        3.5.1 实验环境第33-34页
        3.5.2 实验结果第34-36页
    3.6 本章小结第36-37页
第四章 基于Spark的数据填充系统设计与实现第37-57页
    4.1 填充算法并行化设计第37-39页
    4.2 内存计算优化策略第39-44页
        4.2.1 属性映射表构建第39-40页
        4.2.2 属性映射表查询第40-41页
        4.2.3 数据集缓存优化第41页
        4.2.4 广播变量应用第41-42页
        4.2.5 负载均衡优化第42-44页
    4.3 Spark平台设计及实现第44-48页
        4.3.1 Spark平台设计第44-47页
        4.3.2 实验结果第47-48页
    4.4 数据填充系统实现第48-54页
        4.4.1 系统功能及架构第48-50页
        4.4.2 系统模块设计第50-54页
    4.5 本章小结第54-57页
第五章 总结与展望第57-59页
    5.1 工作结论第57-58页
    5.2 工作展望第58-59页
参考文献第59-63页
致谢第63-65页
攻读学位期间发表的学术论文目录第65页

论文共65页,点击 下载论文
上一篇:命名实体消歧的研究与实现
下一篇:基于参与式感知的环境检测平台web端数据可视化方案设计与实现