| 致谢 | 第1-6页 |
| 摘要 | 第6-7页 |
| ABSTRACT | 第7-11页 |
| 1 引言 | 第11-18页 |
| ·研究背景 | 第11-12页 |
| ·研究现状 | 第12-14页 |
| ·国外研究现状 | 第12-14页 |
| ·国内研究现状 | 第14页 |
| ·研究内容及意义 | 第14-16页 |
| ·研究内容 | 第15页 |
| ·研究意义 | 第15-16页 |
| ·论文组织结构 | 第16-18页 |
| 2 理论及相关技术综述 | 第18-32页 |
| ·HADOOP系统 | 第18-22页 |
| ·分布式文件系统HDFS | 第19-21页 |
| ·MapReduce研究 | 第21-22页 |
| ·聚类分析介绍 | 第22-25页 |
| ·聚类分析算法分类 | 第25-30页 |
| ·算法的比较与选择 | 第30-32页 |
| ·聚类算法比较 | 第30-31页 |
| ·聚类算法选择 | 第31-32页 |
| 3 CHAMELEON算法的改进及并行化实现 | 第32-46页 |
| ·现有CHAMELEON算法介绍 | 第32-36页 |
| ·传统Chameleon算法 | 第32-33页 |
| ·M-Chameleon算法 | 第33-35页 |
| ·算法存在的问题 | 第35-36页 |
| ·CHAMELEON算法改进 | 第36-46页 |
| ·算法改进的思想 | 第36-38页 |
| ·MR-Chameleon算法的实现 | 第38-40页 |
| ·基于hadoop的MR-Chameleon算法并行化设计与实现 | 第40-42页 |
| ·算法性能分析 | 第42-46页 |
| 4 动车组质量问题定位与预测 | 第46-59页 |
| ·动车组质量问题需求分析 | 第46页 |
| ·实验数据 | 第46-51页 |
| ·数据的选取 | 第47-48页 |
| ·数据预处理 | 第48-51页 |
| ·实验环境及过程 | 第51-54页 |
| ·实验环境 | 第51-52页 |
| ·实验过程 | 第52-54页 |
| ·实验结果分析 | 第54-59页 |
| ·质量问题定位 | 第55-56页 |
| ·质量问题预测 | 第56-57页 |
| ·实验结果可视化展示 | 第57-59页 |
| 5 总结与展望 | 第59-61页 |
| ·工作总结 | 第59页 |
| ·工作展望 | 第59-61页 |
| 参考文献 | 第61-64页 |
| 作者简历及攻读硕士学位期间取得的研究成果 | 第64-66页 |
| 学位论文数据集 | 第66页 |