首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于密度峰值的大数据多粒度分析研究

摘要第6-8页
abstract第8-10页
第一章 绪论第15-29页
    1.1 引言第15-16页
    1.2 大数据第16-21页
        1.2.1 大数据的定义第16-17页
        1.2.2 大数据带来的挑战与机遇第17-18页
        1.2.3 大数据处理研究现状第18-20页
        1.2.4 目前大数据分析研究趋势第20-21页
    1.3 基于粒计算的大数据分析第21-26页
        1.3.1 粒计算概述第21-24页
        1.3.2 粒计算在大数据分析中的优势第24页
        1.3.3 大数据的粒计算分析框架第24-26页
    1.4 本文的研究工作和组织结构第26-29页
第二章 聚类与半监督学习相关准备知识第29-42页
    2.1 引言第29页
    2.2 基于密度峰值的聚类第29-32页
        2.2.1 聚类中心的特征第30-31页
        2.2.2 中心点和异常点特征第31页
        2.2.3 算法步骤第31-32页
        2.2.4 与其他聚类方法的对比分析第32页
    2.3 基于图的半监督学习第32-34页
        2.3.1 半监督学习第32-34页
        2.3.2 基于图的半监督学习第34页
    2.4 高维数据降维第34-35页
        2.4.1 局部线性嵌入第34-35页
        2.4.2 局部敏感哈希第35页
    2.5 大数据平台Spark介绍第35-37页
        2.5.1 Spark平台来源及特征第35-36页
        2.5.2 Spark架构第36页
        2.5.3 Spark编程模型第36-37页
    2.6 学习过程的效率评价第37-38页
        2.6.1 时间复杂性第37页
        2.6.2 空间复杂性第37-38页
    2.7 学习结果的准确性评价第38-41页
        2.7.1 聚类评价第38-39页
        2.7.2 分类评价第39-40页
        2.7.3 回归分析评价第40-41页
    2.8 小结第41-42页
第三章 基于密度峰值的高效多粒度聚类第42-68页
    3.1 引言第42-44页
    3.2 相关研究工作第44-45页
        3.2.1 密度峰值聚类第44页
        3.2.2 多粒度聚类与多粒度计算第44-45页
    3.3 DenPEHC算法第45-54页
        3.3.1 DPClust中参数曲线的分析第45-46页
        3.3.2 聚类中心点的自动选择第46-48页
        3.3.3 DPClust中的引领树第48-49页
        3.3.4 DenPEHC算法描述第49-52页
        3.3.5 异常点检测第52-53页
        3.3.6 复杂性分析第53-54页
    3.4 海量高维数据的DenPEHC聚类第54-58页
        3.4.1 海量高维数据的多粒度聚类第54-55页
        3.4.2 DenPEHC-LSHD算法第55页
        3.4.3 类别属性取值的距离度量第55-57页
        3.4.4 子集规模的确定第57-58页
        3.4.5 水平粒化的加速效应第58页
    3.5 实验第58-67页
        3.5.1 实验环境与数据集第58-59页
        3.5.2 实验结果与评价第59-67页
    3.6 小结第67-68页
第四章 基于胖节点引领树和密度峰值的数据流聚类第68-97页
    4.1 引言第68-70页
    4.2 相关研究工作第70-72页
    4.3 引领树结构中的偏序关系第72页
    4.4 DP-Stream算法第72-82页
        4.4.1 引领树和胖节点引领树的粒化第73-75页
        4.4.2 异常点检测第75-77页
        4.4.3 胖节点引领树的增量式更新第77-79页
        4.4.4 概念漂移检测第79-81页
        4.4.5 数据老化与弱节点删除第81-82页
    4.5 复杂性分析第82-83页
    4.6 实验第83-95页
        4.6.1 实验环境与数据集第83-84页
        4.6.2 实验结果与分析第84-95页
    4.7 小结第95-97页
第五章 基于局部密度的最优粒化和流形信息粒表示第97-122页
    5.1 引言第97-98页
    5.2 相关研究工作第98-99页
        5.2.1 可验证粒度准则第99页
        5.2.2 局部线性嵌入(LLE)第99页
    5.3 基于局部密度的最优粒化第99-102页
    5.4 信息粒的流形描述第102-106页
        5.4.1 信息粒的流形描述子构建第102-103页
        5.4.2 从流形描述子重建数据第103-105页
        5.4.3 流形描述子的评价第105-106页
    5.5 LoDOG信息粒的可解释性第106-107页
    5.6 复杂性分析第107-110页
        5.6.1 LoDOG复杂性分析第107-108页
        5.6.2 关于流形描述子的复杂性第108-109页
        5.6.3 与其他研究工作的关系第109-110页
    5.7 实验第110-121页
        5.7.1 实验环境和数据集第110页
        5.7.2 实验结果与分析第110-121页
    5.8 小结第121-122页
第六章 最优引领森林上的非迭代式标签传播第122-143页
    6.1 引言第122-123页
    6.2 相关研究工作第123-126页
        6.2.1 基于图的半监督学习(GSSL)第123-124页
        6.2.2 最优引领森林第124-126页
    6.3 最优引领森林上的标签传播第126-132页
        6.3.1 LaPOLeaF标签传播的三阶段分析第127-129页
        6.3.2 LaPOLeaF算法第129-132页
    6.4 新增数据的快速学习第132页
    6.5 针对大数据的LaPOLeaF第132-135页
        6.5.1 分治法与并行计算策略第132-134页
        6.5.2 使用LSH的近似计算方法第134-135页
    6.6 复杂性分析第135-136页
        6.6.1 复杂性分析第135-136页
        6.6.2 与其他方法的关系讨论第136页
    6.7 实验第136-140页
        6.7.1 实验环境与数据集第136-137页
        6.7.2 实验结果与分析第137-140页
    6.8 LaPOLeaF在水质预测中的应用第140-142页
    6.9 小结第142-143页
第七章 总结与展望第143-146页
    7.1 本文工作总结第143-144页
    7.2 未来工作展望第144-146页
致谢第146-147页
参考文献第147-158页
攻读博士学位期间的研究成果第158-159页

论文共159页,点击 下载论文
上一篇:体育价值研究
下一篇:高故障检测率与故障定位技术研究