首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

数据质量控制:数据预处理研究、设计与实现

1 引言第1-9页
2 数据预处理第9-16页
   ·概论第9-11页
   ·预处理的基本功能第11-12页
     ·数据集成(Data Integration)第11页
     ·数据清洗(Data Cleaning)第11-12页
     ·数据变换(Data Transformation)第12页
     ·数据简化(Data Reduction)第12页
   ·预处理的主要方法第12-15页
     ·基于粗糙集理论的约简方法第13页
     ·基于概念树的数据浓缩方法第13-14页
     ·信息论思想和普化知识发现第14页
     ·基于统计分析的属性选取方法第14-15页
     ·遗传算法(GA)第15页
   ·数据预处理小结第15-16页
3 数据仓库的质量控制--ETL第16-24页
   ·术语描述第16页
   ·ETL是DW建立的核心过程第16-17页
   ·ETL体系结构第17-18页
   ·ETL之数据质量第18-24页
     ·单数据源问题第20-22页
     ·多数据源问题第22-23页
     ·解决方法第23-24页
4 企业运营数据ETL第24-38页
   ·ETL实例分析、设计与实现第24-36页
     ·数据抽取与传输第25-29页
     ·数据转换与清洗第29-34页
     ·数据加载入库第34-35页
     ·统一调度与监控第35页
     ·元数据管理第35-36页
   ·市场上主流的ETL工具第36-37页
   ·ETL小结与未来工作第37-38页
5 主题网站质量控制框架第38-47页
   ·研究背景第38-40页
   ·框架设计第40-42页
     ·两种模型第40页
     ·质量控制三阶段第40-42页
   ·文本预处理第42-47页
     ·模块流程第42-43页
     ·模块分析第43-47页
6 框架中的新方案第47-63页
   ·基于相似度的高速匹配方案第47-51页
     ·匹配策略第48-49页
     ·模板构造第49-50页
     ·文本预处理第50-51页
   ·基于SVM的增量训练方案第51-63页
     ·Support Vector Machine第51-55页
     ·增量式SVM训练第55-59页
     ·相关实验第59-62页
     ·ISVM小结第62-63页
   ·进一步讨论第63页
7 结束语第63-64页
参考文献第64-67页
本文作者在攻读硕士学位期间发表的文章第67页
声明第67页
致谢第67-68页

论文共68页,点击 下载论文
上一篇:关于商业银行不良贷款的防范化解研究
下一篇:面向设计企业提高效益的设计资源管理研究