首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

动车组大数据清洗关键技术研究与实现

致谢第5-6页
摘要第6-7页
ABSTRACT第7-8页
1 引言第12-16页
    1.1 研究背景第12页
    1.2 研究意义第12-13页
    1.3 研究现状第13-14页
        1.3.1 动车组大数据清洗研究现状第13页
        1.3.2 数据清洗研究现状第13-14页
    1.4 研究内容第14-15页
    1.5 本章小结第15-16页
2 数据清洗基础理论和关键技术第16-34页
    2.1 数据清洗第16-18页
        2.1.1 数据质量及数据清洗第16-17页
        2.1.2 数据清洗过程第17-18页
        2.1.3 数据问题分类第18页
    2.2 缺失值清洗第18-20页
        2.2.1 采用统计方法清洗缺失值第19页
        2.2.2 采用分类方法清洗缺失值第19-20页
        2.2.3 采用关联规则方法清洗缺失值第20页
    2.3 相似重复记录清洗第20-23页
        2.3.1 字段相似检测算法第20-22页
        2.3.2 相似重复记录检测算法第22-23页
    2.4 离群点清洗第23-29页
        2.4.1 基于统计的离群点检测方法第24-25页
        2.4.2 基于距离的离群点检测方法第25页
        2.4.3 基于密度的离群点检测方法第25-26页
        2.4.4 基于聚类的离群点检测方法第26-29页
    2.5 Hadoop平台介绍第29-33页
        2.5.1 HDFS架构介绍第30-31页
        2.5.2 MapReduce第31-33页
    2.6 本章小结第33-34页
3 动车组数据分析第34-44页
    3.1 动车组数据介绍第35-38页
        3.1.1 数据分类第35-38页
        3.1.2 数据输出第38页
    3.2 动车组数据质量分析第38-41页
        3.2.1 动车组数据问题第39-40页
        3.2.2 动车组数据问题原因分析第40-41页
    3.3 动车组数据特点第41-42页
    3.4 本章小结第42-44页
4 基于Hadoop的分布式动车组大数据离群点清洗方案第44-50页
    4.1 典型数据清洗方案第44页
    4.2 基于Hadoop的分布式数据清洗方案的分析和设计第44-48页
        4.2.1 需求分析第44-45页
        4.2.2 基本设计思想第45页
        4.2.3 设计方案第45-48页
    4.3 本章小结第48-50页
5 基于网格的LOF离群点检测算法研究第50-64页
    5.1 基于网格的LOF离群点检测算法思想第50-56页
        5.1.1 网格剪枝第51-53页
        5.1.2 LOF算法介绍第53-56页
    5.2 基于网格的LOF算法的改进第56-59页
    5.3 基于网格的LOF算法的并行化实现第59-63页
    5.4 本章小结第63-64页
6 实验及结果分析第64-74页
    6.1 实验平台选择与配置第64-68页
        6.1.1 硬件环境第64页
        6.1.2 软件描述第64-65页
        6.1.3 Hadoop平台的安装部署第65-68页
    6.2 实验验证第68-72页
    6.3 本章小结第72-74页
7 结论第74-76页
    7.1 工作总结第74页
    7.2 工作展望第74-76页
参考文献第76-80页
作者简历第80-84页
学位论文数据集第84页

论文共84页,点击 下载论文
上一篇:基于单手操作的智能手机视频APP播放器界面的设计研究--以ios8操作系统为例
下一篇:城市道路网络演化特性与生长模型研究--以北京市为例