首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

数据仓库的数据获取关键技术研究

摘要第1-8页
ABSTRACT第8-9页
第一章 绪论第9-17页
 §1.1 课题背景与意义第9-11页
     ·课题来源第9-10页
     ·数据获取的研究意义第10-11页
 §1.2 国内外研究现状第11-15页
     ·国外研究现状第11-13页
     ·国内研究现状第13-14页
     ·存在问题第14-15页
 §1.3 论文研究的主要内容第15页
 §1.4 论文的组织结构第15-17页
第二章 数据源检测方法分析第17-30页
 §2.1 基于快照差分算法的信息源检测分析第17-23页
     ·快照差分问题的形式化描述第17-18页
     ·多种快照差分算法分析第18-21页
     ·算法比较实验第21-23页
     ·快照差分算法总结第23页
 §2.2 基于日志的数据源检测分析第23-30页
     ·对Oracle数据库日志的检测分析第24-28页
     ·对SQL Server数据库日志的检测分析第28-30页
第三章 数据获取系统的设计第30-38页
 §3.1 系统的设计思路第30页
 §3.2 系统结构和功能第30-31页
  §3.2.1 系统结构第30-31页
  §3.2.2 系统功能第31页
 §3.3 重要子模块介绍第31-38页
     ·简单数据转换模块第31-33页
     ·数据源监视模块第33-36页
     ·重复记录检测模块第36-38页
第四章 重复记录检测方法第38-52页
 §4.1 字符串距离度量第38-46页
     ·字符串距离度量算法分析第38-42页
     ·基于条件概率分布的字符串度量算法第42-45页
     ·实验分析第45-46页
 §4.2 动态聚类算法第46-47页
 §4.3 基于条件概率分布的重复记录检测算法第47-49页
     ·生成canopies第48页
     ·第二次聚类第48页
     ·复杂度计算第48-49页
 §4.4 实验比较分析第49-51页
     ·数据规模第49-50页
     ·本文算法与Merge/Purge重复记录检测算法比较第50-51页
 §4.5 重复记录检测算法评价第51-52页
第五章 结束语第52-54页
 §5.1 本文主要工作和贡献第52页
 §5.2 需要进一步研究的问题第52-54页
致谢第54-55页
参考文献第55-59页
附录 攻读硕士学位期间发表的文章第59页

论文共59页,点击 下载论文
上一篇:一种实用的提高与检验遥感图像解译精度方法——以在农作物遥感估产中的应用为例
下一篇:湘南传统建筑--民居建筑符号及其生态性研究