首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

陕西省“科技云”中数据质量的验证方法

摘要第5-6页
ABSTRACT第6-7页
符号对照表第12-13页
缩略语对照表第13-16页
第一章 绪论第16-22页
    1.1 研究背景第16-17页
    1.2 课题来源及意义第17-18页
    1.3 国内外研究现状第18-19页
    1.4 课题研究内容和组织结构第19-22页
        1.4.1 本论文的主要工作第19-20页
        1.4.2 本文组织结构第20-22页
第二章 数据质量及“科技云”平台概述第22-34页
    2.1 数据质量概述第22-25页
        2.1.1 数据质量的定义第22-23页
        2.1.2 数据质量的影响因素第23-25页
        2.1.3 数据质量的评估维度第25页
    2.2 “科技云”平台简述第25-28页
        2.2.1 “科技云”平台概述第26-27页
        2.2.2 “科技云”平台配置第27-28页
    2.3 “科技云”数据资源第28-32页
        2.3.1 数据资源介绍第28-31页
        2.3.2 数据业务流程第31-32页
    2.4 本章小结第32-34页
第三章 “科技云”数据预处理及质量评估第34-56页
    3.1 “科技云”数据预处理第34-43页
        3.1.1 数据采集第34-37页
        3.1.2 数据分类第37-38页
        3.1.3 特征提取第38-42页
        3.1.4 相似性判定第42-43页
    3.2 “科技云”数据质量评估第43-47页
        3.2.1 数据质量评估方法第43-44页
        3.2.2 数据质量评价指标第44-47页
    3.3 “科技云”数据清洗第47-54页
        3.3.1 数据清洗概述第48-52页
        3.3.2 数据清洗流程第52-54页
    3.4 本章小结第54-56页
第四章 “科技云”中数据冗余及缺失值的验证及处理第56-76页
    4.1 重复缺失数据概述第56-58页
    4.2 完全重复数据验证方法第58-61页
        4.2.1 属性相关度验证第58页
        4.2.2 皮尔逊2c 验证第58-59页
        4.2.3 重复地址验证第59-61页
    4.3 基于动态规划算法的信息缩写重复数据验证及处理第61-67页
        4.3.1 编辑距离第61-63页
        4.3.2 动态规划算法的缩写发现第63-66页
        4.3.3 图-聚类法去除重复信息第66-67页
    4.4 基于最近邻插补法和关联规则的数据缺失验证及处理第67-74页
        4.4.1 缺失属性数据表第67-68页
        4.4.2 关联规则算法第68-71页
        4.4.3 最近邻插值法与关联规则处理缺失值第71-74页
    4.5 本章小结第74-76页
第五章 “科技云”数据验证及分析第76-84页
    5.1 数据应用实例概述第76-78页
        5.1.1 实例属性分析第76-77页
        5.1.2 实例具体展现第77-78页
    5.2 实验结果及分析第78-83页
    5.3 本章小结第83-84页
第六章 总结与展望第84-86页
    6.1 本文总结第84-85页
    6.2 未来展望第85-86页
参考文献第86-88页
致谢第88-90页
作者简介第90-91页

论文共91页,点击 下载论文
上一篇:尖孢镰刀菌人参专化型鉴定及GSK3基因和效应因子的克隆研究
下一篇:轻资产模式下企业价值实现途径研究--以苏宁云商为例