K-means改进算法在多元分系统中的研究和应用

摘要	第4-5页
Abstract	第5-6页
第1章绪论	第9-12页
1.1. 研究背景和意义	第9-10页
1.2. 国内外研究现状	第10-11页
1.3. 论文组织结构	第11-12页
第2章相关技术介绍	第12-20页
2.1. Hadoop技术框架	第12-16页
2.1.1. HDFS文件系统	第13-15页
2.1.2. Map Reduce编程模型	第15-16页
2.2. 数据标准化	第16-17页
2.3. 相似性度量	第17-18页
2.4. 数据类型	第18-20页
第3章 K-means算法研究与分析	第20-31页
3.1. K-means算法描述	第20-22页
3.1.1. K-means算法基本思想	第20页
3.1.2. K-means算法基本步骤	第20-22页
3.2. K-means算法分析	第22-23页
3.2.1. K-means算法优点	第22页
3.2.2. K-means算法存在的问题	第22-23页
3.3. 现有的初始中心的选取方法	第23-24页
3.3.1. K-means++算法	第23页
3.3.2. 最远距离优化	第23页
3.3.3. 密度优先选取	第23-24页
3.4. K值确定方法	第24-25页
3.4.1. 常见评价指标	第24-25页
3.5. 实验结果与分析	第25-30页
3.5.1. 数据集介绍	第26-27页
3.5.2. 实验结果	第27-29页
3.5.3. 实验总结	第29-30页
3.6. 本章小结	第30-31页
第4章迭代选取初始聚类中心的方法	第31-42页
4.1. 迭代选取初始聚类中心的过程和步骤介绍	第31-33页
4.2. 预设半径R的计算方法	第33-35页
4.2.1. R值特点介绍	第33-34页
4.2.2. R值具体的求解方法	第34-35页
4.3. 聚类效果评价指标	第35-37页
4.3.1. Rand系数和Jaccard系数	第35-36页
4.3.2. F值	第36-37页
4.4. 实验结果与分析	第37-41页
4.4.1. 数据集介绍	第37-38页
4.4.2. 实验结果与分析	第38-40页
4.4.3. 实验总结	第40-41页
4.5. 本章小结	第41-42页
第5章改进K-means算法的应用	第42-53页
5.1. 多元分析系统介绍	第42-43页
5.2. 多元分析系统聚类分析	第43-44页
5.3. 混合属性数据的处理	第44-46页
5.3.1. K-modes算法简介	第44-45页
5.3.2. 处理混合属性数据	第45-46页
5.4. 基于Hapdoop的改进K-means算法	第46-49页
5.4.1. 并行化K-means原理	第46-47页
5.4.2. Hadoop下的改进K-means算法设计	第47-49页
5.5. Hadoop实验结果与分析	第49-52页
5.5.1. 数据集介绍	第49页
5.5.2. 实验平台	第49-50页
5.5.3. 实验结果	第50-51页
5.5.4. 实验总结	第51-52页
5.6. 本章小结	第52-53页
第6章总结和展望	第53-55页
6.1. 总结	第53-54页
6.2. 展望	第54-55页
参考文献	第55-58页
致谢	第58页