首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

大规模数据挖掘聚类算法的研究与实现

摘要第1-4页
Abstract第4-8页
第一章 绪论第8-13页
   ·大规模数据挖掘聚类算法的研究背景第8-9页
   ·大规模数据挖掘聚类算法的研究现状第9-11页
     ·聚类算法的研究现状第9页
     ·聚类分析算法存在的问题第9-11页
   ·本文的研究内容及主要工作第11-13页
第二章 大规模数据挖掘理论分析第13-38页
   ·数据挖掘概述第13-17页
     ·数据挖掘的功能第15-16页
     ·数据挖掘常用技术第16-17页
   ·聚类算法理论第17-23页
     ·聚类基础概论第17页
     ·聚类分析的数学模型第17-18页
     ·聚类分析的点、空间和距离测度第18-20页
     ·聚类分析的空间划分第20-21页
     ·聚类分析方法第21页
     ·聚类原型 P第21页
     ·模糊集理论第21-22页
     ·粗糙集理论第22-23页
   ·经典聚类算法综述第23-25页
     ·划分方法(partitioning method)第23-24页
     ·层次方法(hierarchical method)第24页
     ·基于密度的方法(density-based method)第24-25页
     ·基于网格的方法(grid-based method)第25页
     ·基于模型的方法(model-based method)第25页
   ·硬 k 均值聚类算法第25-27页
     ·硬 k 均值聚类分析目标函数第25-26页
     ·硬 k 均值聚类分析求解过程第26-27页
   ·模糊 k-均值聚类算法第27-30页
     ·目标函数演化过程第27-28页
     ·基于目标函数聚类算法的分析求解过程第28页
     ·模糊 k-均值聚类算法实现步骤第28-30页
   ·关于模糊 k 均值聚类部分问题的改进第30-38页
     ·k 值的选取第30-32页
     ·有效性优化第32-33页
     ·适合辨别任意形状的聚类第33-38页
第三章 聚类算法在 Weka 中的实现第38-52页
   ·开源数据挖掘类库 Weka 概述第38-41页
     ·用户使用接口第38-39页
     ·Weka 主要类库分析第39页
     ·Weka 数据输入格式第39-41页
   ·基于 Weka 的二次开发介绍第41-42页
     ·二次开发一般过程第41页
     ·系统开发与运行环境第41-42页
   ·模糊 k-均值聚类算法在 Weka 中的研究与实现第42-47页
     ·类模块关系第42-43页
     ·模糊 k-均值算法的流程第43-44页
     ·模糊 k-均值算法的类说明第44-47页
   ·结果测试第47-52页
     ·数据集介绍第47页
     ·实验一:算法有效性验证实验第47-50页
     ·实验二:k 值选择验证实验第50-52页
第四章 聚类算法的 MapReduce 模式实现第52-68页
   ·分布式文件系统(DFS)第52-55页
     ·计算节点的物理结构第52-53页
     ·大规模文件系统的结构第53-55页
   ·Map-Reduce 设计模式分析第55-59页
     ·Map 任务第56-57页
     ·分组与聚合第57页
     ·Reduce 任务第57页
     ·Map-Reduce 计算过程分析第57-58页
     ·Map-Reduce 用户进程执行细节分析第58-59页
   ·并行环境下基于 MapReduce 的聚类实现第59-63页
     ·基本思路第59-61页
     ·Map-Reduce 函数设计第61页
     ·算法分析第61-62页
     ·程序框架第62-63页
   ·验证实验与分析第63-68页
     ·实验环境搭建第63-66页
     ·Weka 与基于 MapReduce 模式单节点处理比较试验第66-68页
第五章 结论与展望第68-70页
   ·总结第68页
   ·展望第68-70页
致谢第70-72页
参考文献第72-76页
研究成果第76-77页

论文共77页,点击 下载论文
上一篇:图像角点检测算法的研究
下一篇:基于Android平台的文件同步系统设计与实现