首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

面向复杂数据的聚类算法研究

中文摘要第3-5页
Abstract第5-6页
第一章 绪论第15-25页
    1.1 引言第15-16页
    1.2 聚类分析概述第16-17页
    1.3 论文的研究动机第17-20页
    1.4 论文主要工作和贡献第20-22页
        1.4.1 EPC第20-21页
        1.4.2 MulSim第21页
        1.4.3 CLUB第21-22页
        1.4.4 SUM第22页
    1.5 论文组织结构第22-25页
第二章 理论基础与相关工作第25-47页
    2.1 定义和术语第25-26页
        2.1.1 数据集D第25页
        2.1.2 聚类的定义第25-26页
    2.2 相似性计算第26-27页
        2.2.1 常用的距离函数第26页
        2.2.2 常用的相似度函数第26-27页
    2.3 经典聚类方法第27-32页
        2.3.1 基于划分的方法第27-28页
        2.3.2 基于密度的方法第28-30页
        2.3.3 层次方法第30-31页
        2.3.4 基于网格的方法第31-32页
        2.3.5 基于模型的方法第32页
    2.4 其他聚类方法第32-33页
        2.4.1 半监督聚类第32-33页
        2.4.2 基于进化计算的聚类第33页
    2.5 聚类算法常见的问题第33-35页
        2.5.1 簇的个数的确定第33-34页
        2.5.2 相似性度量第34页
        2.5.3 异常点检测第34页
        2.5.4 算法的可扩展性第34-35页
        2.5.5 任意形状、任意密度簇的检测第35页
        2.5.6 高维数据聚类第35页
        2.5.7 聚类结果的可解释性第35页
    2.6 当前聚类研究热点第35-42页
        2.6.1 任意密度、任意形状簇的挖掘第36-38页
        2.6.2 图聚类第38-40页
        2.6.3 面向特定应用的聚类第40-41页
        2.6.4 高维聚类第41页
        2.6.5 无输入参数的聚类第41-42页
        2.6.6 聚类中的异常点检测第42页
    2.7 常用聚类质量评价方法第42-47页
        2.7.1 外在评价方法第43-45页
        2.7.2 内在评价方法第45-47页
第三章 EPC: 基于环境污染特征的抽样数据聚类算法第47-69页
    3.1 引言第47-48页
    3.2 环境污染抽样数据的特点第48-49页
    3.3 相关理论及概念第49-52页
        3.3.1 环境污染抽样数据集第49-50页
        3.3.2 相似性函数第50-51页
        3.3.3 相似性度量第51-52页
    3.4 EPC算法第52-56页
        3.4.1 EPC算法概述第52-54页
        3.4.2 EPC过程第54页
        3.4.3 数据点的再分配第54-55页
        3.4.4 EPC算法与基于划分的经典聚类方法的不同第55-56页
        3.4.5 时间复杂度分析第56页
    3.5 实验分析第56-67页
        3.5.1 聚类质量评价第57页
        3.5.2 生成人工数据集第57-59页
        3.5.3 实验 1: 聚类有类标签且不含异常点的大气污染受体点数据集第59-60页
        3.5.4 实验 2: 聚类无类标签且包含异常点的大气污染受体点数据集第60-65页
        3.5.5 实验 3: 聚类实际大气污染抽样数据集第65-67页
    3.6 小结第67-69页
第四章 MulSim:基于单点与多点相似的聚类算法第69-84页
    4.1 引言第69-70页
    4.2 相关理论与概念第70-72页
        4.2.1 一个新的距离函数第70-71页
        4.2.2 相似性度量第71页
        4.2.3 单个点与多点相似的聚类策略第71-72页
    4.3 MulSim算法第72-74页
        4.3.1 MulSim聚类过程第72-73页
        4.3.2 时间复杂度分析第73-74页
    4.4 实验分析第74-82页
        4.4.1 数据集和比较算法第74-75页
        4.4.2 聚类二维数据集第75-81页
        4.4.3 聚类多维数据集第81-82页
        4.4.4 应用实例第82页
        4.4.5 MulSim的主要贡献第82页
    4.5 小结第82-84页
第五章 CLUB:使用k NN发现簇密度主干的聚类算法第84-104页
    5.1 引言第84-86页
    5.2 CLUB算法第86-89页
        5.2.1 相关理论及概念第86-87页
        5.2.2 CLUB聚类过程第87-89页
        5.2.3 时间复杂度分析第89页
    5.3 实验分析第89-103页
        5.3.1 数据集和比较算法第90页
        5.3.2 聚类二维数据集第90-97页
        5.3.3 聚类多维数据集第97-99页
        5.3.4 CLUB在第二步选取前一半密度较高的数据点的合理性第99页
        5.3.5 k的估计第99-101页
        5.3.6 应用实例第101页
        5.3.7 CLUB的优点第101-103页
    5.4 小结第103-104页
第六章 SUM: 基于质疑最大度顶点的图聚类算法第104-122页
    6.1 引言第104-105页
    6.2 算法第105-111页
        6.2.1 相关理论及概念第105页
        6.2.2 相邻顶点间的相似性度量第105-106页
        6.2.3 算法过程第106-111页
        6.2.4 时间复杂度分析第111页
    6.3 实验及结果第111-120页
        6.3.1 基准数据集及对比算法第111-113页
        6.3.2 聚类有真实簇结构的图第113-117页
        6.3.3 聚类无真实簇结构的图第117页
        6.3.4 SUM的贡献及优点第117-120页
    6.4 小结第120-122页
第七章 总结与展望第122-124页
    7.1 本文工作总结第122-123页
    7.2 下一步需要开展的工作第123-124页
参考文献第124-136页
在学期间的研究成果第136-137页
致谢第137-138页

论文共138页,点击 下载论文
上一篇:重载作用下装配式预应力混凝土箱梁桥疲劳性能研究
下一篇:集装箱模块化建筑的抗连续倒塌性能分析