首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

局部离群点检测算法在Hadoop上的研究与实现

摘要第6-7页
Abstract第7-8页
第1章 绪论第13-19页
    1.1 课题研究背景第13-14页
    1.2 课题研究意义第14页
    1.3 国内外研究及发展概况第14-17页
        1.3.1 数据挖掘发展概况第14-15页
        1.3.2 局部离群点检测算法发展概况第15页
        1.3.3 密度聚类算法发展概况第15-16页
        1.3.4 Hadoop分布式计算平台发展概况第16-17页
        1.3.5 基于Hadoop的离群点检测算法发展概况第17页
    1.4 本文主要工作第17-18页
    1.5 论文结构安排第18页
    1.6 本章小结第18-19页
第2章 离群点检测与密度聚类相关理论第19-29页
    2.1 离群点检测算法概述第19-21页
        2.1.1 离群点概述第19页
        2.1.2 常用的离群点检测方法概述第19-20页
        2.1.3 离群点检测方法性能度量与距离计算第20-21页
    2.2 基于密度的离群点检测算法理论与方法第21-24页
        2.2.1 LOF算法第21-23页
        2.2.2 COF算法第23页
        2.2.3 INFLOF算法概述第23-24页
        2.2.4 MDEF算法概述第24页
    2.3 密度聚类理论与方法第24-27页
        2.3.1 DBSCAN算法第25-26页
        2.3.2 DENCLUE算法第26-27页
    2.4 本章小结第27-29页
第3章 Hadoop分布式平台第29-37页
    3.1 引言第29页
    3.2 HDFS分布式文件系统第29-31页
        3.2.1 NameNode第30-31页
        3.2.2 DataNode第31页
        3.2.3 客户端第31页
    3.3 MapReduce计算框架第31-33页
        3.3.1 MapReduce编程模型第31-32页
        3.3.2 Hadoop中MapReduce执行架构第32-33页
    3.4 HBase分布式数据库第33-36页
        3.4.1 HBase系统架构第33-35页
        3.4.2 HBase的数据模型第35-36页
    3.5 本章小结第36-37页
第4章 基于密度聚类的分布式离群点检测算法第37-47页
    4.1 基于密度聚类的离群点检测算法第37-40页
        4.1.1 基于DBSCAN算法的数据预处理第37-38页
        4.1.2 改进的LOF算法实现第38-39页
        4.1.3 算法性能分析第39-40页
    4.2 信息熵确定属性权重第40-41页
        4.2.1 熵理论第40页
        4.2.2 信息熵第40-41页
        4.2.3 改进算法的实现第41页
    4.3 数据划分第41-42页
        4.3.1 块切分第42页
        4.3.2 块编码第42页
        4.3.3 块分配第42页
    4.4 基于密度聚类的离群点检测算法并行化的实现第42-46页
        4.4.1 数据源处理第43页
        4.4.2 算法步骤与描述第43-44页
        4.4.3 基于信息熵改进的算法步骤第44-46页
    4.5 本章小结第46-47页
第5章 仿真实验与结果分析第47-55页
    5.1 实验环境搭建第47-49页
    5.2 算法实验数据集第49页
    5.3 实验结果与分析第49-53页
        5.3.1 基于密度聚类的LOF算法实验对比第49-51页
        5.3.2 信息熵加权后的实验对比第51页
        5.3.3 数据可扩展性实验第51-52页
        5.3.4 实验总结第52-53页
    5.4 本章小结第53-55页
总结与展望第55-57页
参考文献第57-61页
攻读硕士学位期间发表论文第61-63页
致谢第63-64页

论文共64页,点击 下载论文
上一篇:自然场景图片中文本定位方法研究
下一篇:基于Lucene的企业搜索引擎的设计与实现