基于实例的异构数据模式匹配方法研究与实现
致谢 | 第5-6页 |
摘要 | 第6-7页 |
ABSTRACT | 第7页 |
1 引言 | 第11-22页 |
1.1 研究背景 | 第11-14页 |
1.2 研究目的及意义 | 第14-16页 |
1.3 研究现状 | 第16-20页 |
1.4 研究内容 | 第20-21页 |
1.5 论文组织框架 | 第21页 |
1.6 本章小结 | 第21-22页 |
2 相关理论基础 | 第22-35页 |
2.1 数据模式概述 | 第22-24页 |
2.1.1 数据模式相关概念 | 第22-23页 |
2.1.2 异构数据模式及其特点 | 第23-24页 |
2.1.3 数据实例相关概念 | 第24页 |
2.2 匹配方法分类 | 第24-26页 |
2.2.1 可表达匹配与不可表达匹配 | 第24-25页 |
2.2.2 元素匹配与结构匹配 | 第25-26页 |
2.3 特征信息提取 | 第26-28页 |
2.3.1 信息熵及其意义 | 第26页 |
2.3.2 条件熵与互信息 | 第26-27页 |
2.3.3 属性列分布及似然估计 | 第27-28页 |
2.4 元素匹配策略 | 第28-29页 |
2.5 匹配性能优化 | 第29页 |
2.6 匹配结果的评价指标 | 第29-30页 |
2.6.1 匹配准确率 | 第29-30页 |
2.6.2 匹配算法运行耗时 | 第30页 |
2.6.3 匹配算法的健壮性 | 第30页 |
2.7 模式匹配与机器学习 | 第30-33页 |
2.7.1 无监督匹配器集成方法 | 第31-32页 |
2.7.2 有监督匹配器集成方法 | 第32页 |
2.7.3 基于主动学习的匹配器集成方法 | 第32-33页 |
2.8 本章小结 | 第33-35页 |
3 基于有序互信息的模式匹配方法 | 第35-44页 |
3.1 问题描述 | 第35-36页 |
3.2 数据预处理 | 第36-37页 |
3.3 特征信息提取 | 第37页 |
3.4 相似建模 | 第37-39页 |
3.5 匹配策略设计 | 第39页 |
3.6 匹配算法优化 | 第39-40页 |
3.7 有序互信息图匹配算法 | 第40-43页 |
3.8 本章小结 | 第43-44页 |
4 实验结果与分析 | 第44-54页 |
4.1 实验环境 | 第44页 |
4.2 实验数据集 | 第44-45页 |
4.3 实验设计思路 | 第45-47页 |
4.3.1 数据预处理环节 | 第46页 |
4.3.2 有序互信息匹配环节 | 第46-47页 |
4.3.3 统计性能指标环节 | 第47页 |
4.4 实验结果与分析 | 第47-53页 |
4.4.1 匹配算法准确率对比实验 | 第47-49页 |
4.4.2 匹配算法耗时对比实验 | 第49-50页 |
4.4.3 数据实例中元组数量影响评估实验 | 第50-51页 |
4.4.4 数据实例信息熵分布影响评估实验 | 第51-53页 |
4.5 本章小结 | 第53-54页 |
5 总结与展望 | 第54-57页 |
5.1 工作总结 | 第54-56页 |
5.2 不足与展望 | 第56-57页 |
参考文献 | 第57-60页 |
作者简历及攻读硕士学位期间取得的研究成果 | 第60-62页 |
学位论文数据集 | 第62页 |