数据清洗及其在宝钢计划值系统中的应用
第一章 引言 | 第1-17页 |
·项目背景 | 第11-12页 |
·数据清洗的研究现状 | 第12-14页 |
·论文研究的意义 | 第14-15页 |
·论文工作介绍 | 第15页 |
·论文的组织 | 第15-17页 |
第二章 数据清洗技术 | 第17-27页 |
·数据清洗的来源 | 第17页 |
·数据清洗的定义 | 第17-18页 |
·数据质量问题 | 第18-23页 |
·单数据源问题 | 第19-20页 |
·多数据源问题 | 第20-21页 |
·检测错误数据的方法 | 第21-23页 |
·数据清洗的过程 | 第23-24页 |
·一种基于N-Gram的聚类算法 | 第24-25页 |
·小结 | 第25-27页 |
第三章 宝钢计划值系统及SAS8.2 | 第27-50页 |
·计划值管理制度 | 第27-29页 |
·计划值管理回顾 | 第27-28页 |
·现状及存在的问题 | 第28-29页 |
·新计划值系统的发展方向 | 第29-34页 |
·计划值工作的定位 | 第29-31页 |
·项目体系 | 第31-32页 |
·分析方法 | 第32-33页 |
·编制周期 | 第33页 |
·工作重点 | 第33页 |
·发展前景 | 第33-34页 |
·新计划值系统基本设计 | 第34-39页 |
·系统功能设计 | 第34-36页 |
·数据库物理设计 | 第36-39页 |
·数据清洗任务 | 第39-40页 |
·SAS8.2与数据仓库 | 第40-48页 |
·利用SAS技术构建数据仓库 | 第41-45页 |
·SAS数据仓库的组成 | 第45-48页 |
·小结 | 第48-50页 |
第四章 数据清洗在计划值系统中的应用 | 第50-63页 |
·计划值系统数据流程 | 第50-51页 |
·计划值系统中的数据清洗任务 | 第51-60页 |
·定义时间范围 | 第51-52页 |
·抽取合格的日数据 | 第52-55页 |
·其它具体的清洗任务 | 第55-60页 |
·计划值机组投入量下移 | 第56-58页 |
·完善线材原料重量差异 | 第58-59页 |
·C109/C209取数逻辑完善 | 第59页 |
·确定班别/班次 | 第59-60页 |
·数据清洗任务的实现结果 | 第60-62页 |
·小结 | 第62-63页 |
第五章 一种基于欧氏距离的聚类算法 | 第63-75页 |
·聚类分析的方法 | 第63-64页 |
·样品间的距离 | 第64-67页 |
·聚类算法及其实现 | 第67-74页 |
·聚类算法的具体过程 | 第68-69页 |
·聚类算法的实现 | 第69-74页 |
·小结 | 第74-75页 |
第六章 总结 | 第75-79页 |
·数据清洗技术研究方向 | 第75-76页 |
·论文工作总结 | 第76-77页 |
·论文的创新点 | 第77-78页 |
·进一步工作 | 第78-79页 |
参考文献 | 第79-82页 |
附录1 数据清洗相关实现代码 | 第82-89页 |
附录2 SAS编程语言简介 | 第89-92页 |
攻读学位期间发表的学术论文目录 | 第92-93页 |
致谢 | 第93页 |