摘要 | 第3-4页 |
Abstract | 第4-5页 |
第一章 绪论 | 第8-16页 |
1.1 本文研究背景及意义 | 第8-9页 |
1.2 数据挖掘技术在国内外的研究现状 | 第9-12页 |
1.2.1 国外的研究现状 | 第9-10页 |
1.2.2 国内的研究现状 | 第10-12页 |
1.3 论文研究的内容和解决方案 | 第12-13页 |
1.3.1 研究内容 | 第12页 |
1.3.2 解决办法 | 第12-13页 |
1.4 论文组织架构 | 第13-14页 |
1.5 本章小结 | 第14-16页 |
第二章 基于凝聚层次的聚类分析 | 第16-22页 |
2.1 层次聚类的方法 | 第16-18页 |
2.1.1 两种基本的层次聚类方法 | 第16-17页 |
2.1.2 类之间距离的度量方法 | 第17-18页 |
2.2 凝聚层次聚类分析在资金分配中的应用 | 第18-19页 |
2.3 复杂性分析 | 第19-20页 |
2.4 本章小结 | 第20-22页 |
第三章 数据预处理 | 第22-28页 |
3.1 数据预处理的概念 | 第22页 |
3.2 数据预处理的重要性 | 第22-23页 |
3.2.1 不一致性 | 第22-23页 |
3.2.2 含噪声 | 第23页 |
3.2.3 不完整性 | 第23页 |
3.3 资金分配基础数据中的数据预处理 | 第23-25页 |
3.3.1 删除无用的指标 | 第24页 |
3.3.2 规范数据单位 | 第24页 |
3.3.3 填充缺失值 | 第24-25页 |
3.3.4 去除噪声数据 | 第25页 |
3.4 数据的归一化 | 第25-26页 |
3.4.1 Min-max归一法 | 第25-26页 |
3.4.2 Z-score归一法 | 第26页 |
3.4.3 Decimal Scaling归一法 | 第26页 |
3.5 基于Z-score方法的资金需求基础数据标准化处理 | 第26-27页 |
3.6 本章小结 | 第27-28页 |
第四章 相似度计算 | 第28-36页 |
4.1 相似度的概念 | 第28-29页 |
4.1.1 数值型 | 第28页 |
4.1.2 非数值型 | 第28-29页 |
4.1.3 混合型 | 第29页 |
4.2 数值型数据相似度计算方法 | 第29-30页 |
4.2.1 曼哈顿距离 | 第29页 |
4.2.2 欧氏距离 | 第29页 |
4.2.3 闵可夫斯基距离 | 第29-30页 |
4.2.4 马氏距离 | 第30页 |
4.2.5 相关系数 | 第30页 |
4.3 欧氏距离和马氏距离在资金分配数据中的应用对比 | 第30-34页 |
4.3.1 A市数据的预处理 | 第30-32页 |
4.3.2 计算欧氏距离和马氏距离 | 第32-33页 |
4.3.3 计算相关系数 | 第33-34页 |
4.4 聚类结果与实际分配结果对比 | 第34-35页 |
4.5 本章小结 | 第35-36页 |
第五章 凝聚层次聚类改进算法的阐述 | 第36-40页 |
5.1 改进算法阐述 | 第36-37页 |
5.1.1 对原算法的思考 | 第36-37页 |
5.1.2 改进算法的描述 | 第37页 |
5.2 改进算法效率与原算法效率对比 | 第37-38页 |
5.3 本章小结 | 第38-40页 |
第六章 实验及结果 | 第40-50页 |
6.1 十三五期间资金需求实例分析 | 第40-44页 |
6.1.1 标准化原始数据 | 第40-43页 |
6.1.2 聚类分析 | 第43-44页 |
6.1.3 相关系数 | 第44页 |
6.2 系统与评价 | 第44-48页 |
6.2.1 系统 | 第44-47页 |
6.2.2 评价 | 第47-48页 |
6.3 本章小结 | 第48-50页 |
第七章 总结与展望 | 第50-52页 |
7.1 对论文的总结 | 第50-51页 |
7.2 对未来的展望 | 第51-52页 |
附录 | 第52-58页 |
参考文献 | 第58-60页 |
致谢 | 第60页 |