基于聚类的数据清洗研究

摘要	第6-7页
Abstract	第7-8页
第1章绪论	第13-19页
1.1 课题研究背景及意义	第13-14页
1.2 课题研究现状	第14-16页
1.3 本文主要工作	第16页
1.4 本文组织结构	第16-19页
第2章数据清洗研究	第19-27页
2.1 数据清洗定义	第19-20页
2.2 数据清洗的原理与方法	第20-23页
2.2.1 数据清洗的原理	第20-21页
2.2.2 数据清洗的方法	第21-23页
2.3 数据清洗的基本过程	第23-25页
2.4 数据清洗的评价标准	第25-26页
2.4.1 数据质量	第25页
2.4.2 成本效益	第25-26页
2.4.3 数据集成	第26页
2.5 本章小结	第26-27页
第3章缺失值清洗和聚类	第27-33页
3.1 缺失值简述	第27页
3.1.1 缺失值的概念	第27页
3.1.2 缺失值产生的原因	第27页
3.2 常用的缺失值清洗方法	第27-30页
3.3 聚类简述	第30-31页
3.3.1 聚类分析简介	第30-31页
3.3.2 聚类分析特征	第31页
3.3.3 聚类分析的基本步骤	第31页
3.4 本章小结	第31-33页
第4章基于距离最大化和缺失数据聚类的填充算法研究	第33-43页
4.1 基于K-means聚类的缺失值填充算法	第33-37页
4.1.1 K-means聚类算法	第33-34页
4.1.2 填充算法描述及流程	第34-36页
4.1.3 填充相似度度量方法	第36-37页
4.2 距离最大化改进策略	第37-39页
4.3 含缺失数据数据集聚类策略	第39-40页
4.4 离散型数据填充策略	第40-41页
4.5 改进后算法步骤及流程	第41-42页
4.6 本章小结	第42-43页
第5章实验与分析	第43-55页
5.1 实验环境	第43页
5.2 实验数据集的选择	第43-44页
5.3 实验设计	第44-46页
5.4 实验结果与分析	第46-52页
5.5 本章小结	第52-55页
第6章总结与展望	第55-57页
6.1 全文总结	第55页
6.2 工作展望	第55-57页
参考文献	第57-63页
附录	第63-65页
攻读硕士学位期间发表的论文	第65-67页
致谢	第67页