面向数据集成的数据清理关键技术研究
| 摘要 | 第1-7页 |
| ABSTRACT | 第7-12页 |
| 第1章 绪论 | 第12-19页 |
| ·研究背景 | 第12-15页 |
| ·问题分析 | 第15-16页 |
| ·研究内容 | 第16-18页 |
| ·论文的组织结构 | 第18-19页 |
| 第2章 相关工作研究现状 | 第19-36页 |
| ·数据集成与数据质量 | 第19-26页 |
| ·数据集成系统 | 第19-20页 |
| ·数据质量管理 | 第20-25页 |
| ·研究问题 | 第25-26页 |
| ·数据集成流程建模与优化 | 第26-31页 |
| ·流程建模与设计 | 第27-29页 |
| ·流程性能优化 | 第29-30页 |
| ·研究问题 | 第30-31页 |
| ·基于约束理论的数据清理技术 | 第31-35页 |
| ·理论基础 | 第31-32页 |
| ·一致性查询 | 第32-33页 |
| ·面向数据清理的约束扩展 | 第33-34页 |
| ·研究问题 | 第34-35页 |
| ·小结 | 第35-36页 |
| 第3章 数据集成流程中的异常数据检测 | 第36-61页 |
| ·引言 | 第36-37页 |
| ·问题定义 | 第37-42页 |
| ·数据集成流程 | 第37-38页 |
| ·数据质量规则 | 第38-39页 |
| ·异常数据检测 | 第39-40页 |
| ·一个例子 | 第40-42页 |
| ·反向约束传播框架 | 第42-44页 |
| ·基于关系代数的投影规则 | 第44-47页 |
| ·基于语义标注的复杂转换操作的投影规则 | 第47-56页 |
| ·投影方法分析与比较 | 第56页 |
| ·实验评价 | 第56-59页 |
| ·相关工作 | 第59-60页 |
| ·小结 | 第60-61页 |
| 第4章 基于 NULL 修复的一致性查询 | 第61-82页 |
| ·引言 | 第61-64页 |
| ·理论基础 | 第64-66页 |
| ·定位不一致属性 | 第66-70页 |
| ·查询重写方法 | 第70-77页 |
| ·非聚集查询 | 第70-73页 |
| ·聚集查询 | 第73-77页 |
| ·实验评价 | 第77-80页 |
| ·实验设置 | 第77-78页 |
| ·实验结果 | 第78-80页 |
| ·相关工作 | 第80-81页 |
| ·小结 | 第81-82页 |
| 第5章 基于重构的数据清理流程性能优化 | 第82-96页 |
| ·引言 | 第82-83页 |
| ·问题定义 | 第83-84页 |
| ·数据流程变换规则 | 第84-87页 |
| ·最优流程选择算法 | 第87-89页 |
| ·案例分析与实验 | 第89-94页 |
| ·Mashup 案例 | 第89-92页 |
| ·实验设置 | 第92页 |
| ·流程优化的效果 | 第92-94页 |
| ·最优流程选择算法 | 第94页 |
| ·相关工作 | 第94-95页 |
| ·小结 | 第95-96页 |
| 第6章 数据清理技术在数据集成系统中的实现与应用 | 第96-111页 |
| ·数据集成系统架构 | 第96-102页 |
| ·数据处理组件模型 | 第97-99页 |
| ·数据集成流程管理 | 第99-102页 |
| ·研究成果的系统实现 | 第102-111页 |
| ·反向约束传播的实现 | 第102-107页 |
| ·一致性查询的实现 | 第107-108页 |
| ·流程性能优化技术的实现 | 第108-111页 |
| 第7章 总结与展望 | 第111-114页 |
| ·工作总结 | 第111页 |
| ·进一步工作 | 第111-114页 |
| 参考文献 | 第114-121页 |
| 致谢 | 第121-122页 |
| 在读期间发表的学术论文与取得的研究成果 | 第122-124页 |