首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

K-means改进算法在多元分系统中的研究和应用

摘要第4-5页
Abstract第5-6页
第1章 绪论第9-12页
    1.1. 研究背景和意义第9-10页
    1.2. 国内外研究现状第10-11页
    1.3. 论文组织结构第11-12页
第2章 相关技术介绍第12-20页
    2.1. Hadoop技术框架第12-16页
        2.1.1. HDFS文件系统第13-15页
        2.1.2. Map Reduce编程模型第15-16页
    2.2. 数据标准化第16-17页
    2.3. 相似性度量第17-18页
    2.4. 数据类型第18-20页
第3章 K-means算法研究与分析第20-31页
    3.1. K-means算法描述第20-22页
        3.1.1. K-means算法基本思想第20页
        3.1.2. K-means算法基本步骤第20-22页
    3.2. K-means算法分析第22-23页
        3.2.1. K-means算法优点第22页
        3.2.2. K-means算法存在的问题第22-23页
    3.3. 现有的初始中心的选取方法第23-24页
        3.3.1. K-means++算法第23页
        3.3.2. 最远距离优化第23页
        3.3.3. 密度优先选取第23-24页
    3.4. K值确定方法第24-25页
        3.4.1. 常见评价指标第24-25页
    3.5. 实验结果与分析第25-30页
        3.5.1. 数据集介绍第26-27页
        3.5.2. 实验结果第27-29页
        3.5.3. 实验总结第29-30页
    3.6. 本章小结第30-31页
第4章 迭代选取初始聚类中心的方法第31-42页
    4.1. 迭代选取初始聚类中心的过程和步骤介绍第31-33页
    4.2. 预设半径R的计算方法第33-35页
        4.2.1. R值特点介绍第33-34页
        4.2.2. R值具体的求解方法第34-35页
    4.3. 聚类效果评价指标第35-37页
        4.3.1. Rand系数和Jaccard系数第35-36页
        4.3.2. F值第36-37页
    4.4. 实验结果与分析第37-41页
        4.4.1. 数据集介绍第37-38页
        4.4.2. 实验结果与分析第38-40页
        4.4.3. 实验总结第40-41页
    4.5. 本章小结第41-42页
第5章 改进K-means算法的应用第42-53页
    5.1. 多元分析系统介绍第42-43页
    5.2. 多元分析系统聚类分析第43-44页
    5.3. 混合属性数据的处理第44-46页
        5.3.1. K-modes算法简介第44-45页
        5.3.2. 处理混合属性数据第45-46页
    5.4. 基于Hapdoop的改进K-means算法第46-49页
        5.4.1. 并行化K-means原理第46-47页
        5.4.2. Hadoop下的改进K-means算法设计第47-49页
    5.5. Hadoop实验结果与分析第49-52页
        5.5.1. 数据集介绍第49页
        5.5.2. 实验平台第49-50页
        5.5.3. 实验结果第50-51页
        5.5.4. 实验总结第51-52页
    5.6. 本章小结第52-53页
第6章 总结和展望第53-55页
    6.1. 总结第53-54页
    6.2. 展望第54-55页
参考文献第55-58页
致谢第58页

论文共58页,点击 下载论文
上一篇:在线评论中产品特征提取与意见挖掘研究
下一篇:基于社会标签的无监督微博关键字抽取算法