| 摘要 | 第1-6页 |
| Abstract | 第6-13页 |
| 1 绪论 | 第13-27页 |
| ·研究背景 | 第13-16页 |
| ·信用的概念与信用信息不对称问题 | 第13-14页 |
| ·征信的定义 | 第14页 |
| ·征信系统的产生与功能 | 第14-16页 |
| ·问题的提出 | 第16-21页 |
| ·实体与实体匹配的定义 | 第16页 |
| ·征信系统中实体匹配运算的特点 | 第16-20页 |
| ·研究问题的抽象与研究目标 | 第20-21页 |
| ·理论与现实意义 | 第21-22页 |
| ·现实意义 | 第21-22页 |
| ·理论意义 | 第22页 |
| ·研究的结构与框架 | 第22-27页 |
| ·实体匹配的处理流程 | 第22-24页 |
| ·论文的研究框架 | 第24-27页 |
| 2 实体匹配方法文献综述 | 第27-38页 |
| ·字符串相似度计算 | 第27-31页 |
| ·基于距离的字符串相似度算法 | 第27-29页 |
| ·基于Token的字符串相似度算法 | 第29-31页 |
| ·相似实体的匹配算法 | 第31-36页 |
| ·排序&合并算法 | 第32-33页 |
| ·建索引的方法 | 第33-34页 |
| ·机器学习的方法 | 第34-36页 |
| ·记录簇与XML半结构化文档匹配 | 第36-38页 |
| 3 基于关联token的自适应字符串相似度计算方法 | 第38-57页 |
| ·各种数据类型属性值相似度计算方法介绍 | 第38-39页 |
| ·征信系统中字符型属性相似度计算存在的问题 | 第39-42页 |
| ·自适应字符串相似度计算方法的原理 | 第42-48页 |
| ·基于关联token字符串相似度算法的总体框架 | 第43页 |
| ·关联操作的定义 | 第43-45页 |
| ·相似度函数学习机设计 | 第45-48页 |
| ·改进字符串相似度计算方法 | 第48-52页 |
| ·token关联操作集的细化 | 第49页 |
| ·考虑词频的字符串相似度计算 | 第49-52页 |
| ·实验结果与分析 | 第52-56页 |
| ·实验数据介绍 | 第52页 |
| ·实验方法与评价指标说明 | 第52-53页 |
| ·实验结果与分析 | 第53-56页 |
| ·本章小结 | 第56-57页 |
| 4 有标识字段的实体匹配方法 | 第57-79页 |
| ·征信系统中影响匹配运算效率的问题点 | 第58-60页 |
| ·自适应联合分组模型 | 第60-65页 |
| ·联合分组模型设计 | 第61-63页 |
| ·分组式集的析取式的分析 | 第63-65页 |
| ·分组式集的析取范式分析 | 第65页 |
| ·自适应联合分组模型的求解 | 第65-69页 |
| ·采用析取式的联合分组模型求解 | 第66-67页 |
| ·采用析取范式的联合分组模型求解 | 第67-68页 |
| ·整体分组式的应用 | 第68-69页 |
| ·基于LSVM的有标识字段实体记录匹配方法 | 第69-72页 |
| ·LSVM算法的原理 | 第69-71页 |
| ·求解有标识字段实体记录的匹配函数 | 第71-72页 |
| ·自适应实体记录匹配方法框架 | 第72-74页 |
| ·实验结果与分析 | 第74-78页 |
| ·实验数据介绍 | 第74页 |
| ·实验方法与评价指标介绍 | 第74-75页 |
| ·联合分组模型的实验分析 | 第75-77页 |
| ·LSVM实体匹配方法的实验分析 | 第77-78页 |
| ·本章小结 | 第78-79页 |
| 5 无标识字段的自动实体匹配方法 | 第79-102页 |
| ·自动实体匹配操作需解决的问题 | 第79-81页 |
| ·基于主动学习的半监督式实体匹配方法 | 第81-89页 |
| ·训练样本的聚类 | 第82-85页 |
| ·匹配函数主动学习算法 | 第85-89页 |
| ·两阶段无监督式的自动实体匹配方法 | 第89-97页 |
| ·自动构建初始训练样本集 | 第89-92页 |
| ·基于迭代SVM的匹配函数自学习算法 | 第92-96页 |
| ·两阶段无监督式机器学习的实体匹配方法框架 | 第96-97页 |
| ·实验结果与分析 | 第97-101页 |
| ·实验方法与数据介绍 | 第97-98页 |
| ·实验结果分析 | 第98-101页 |
| ·本章小结 | 第101-102页 |
| 6 记录簇实体和XML半结构化实体的匹配方法 | 第102-124页 |
| ·记录簇实体与XML半结构化实体匹配的技术难点 | 第102-105页 |
| ·记录簇实体 | 第102-104页 |
| ·XML半结构化实体 | 第104-105页 |
| ·记录簇实体匹配模型的构建 | 第105-108页 |
| ·记录簇匹配模式定义 | 第105-106页 |
| ·记录簇匹配的数学模型 | 第106-108页 |
| ·记录簇实体上下界匹配算法设计 | 第108-111页 |
| ·相似度上下界的推导 | 第108-109页 |
| ·上下界匹配算法描述 | 第109-111页 |
| ·记录簇匹配方法的实验与结果分析 | 第111-113页 |
| ·记录簇实体匹配方法与实验数据介绍 | 第111-112页 |
| ·实验结果分析 | 第112-113页 |
| ·XML半结构化实体的匹配方法 | 第113-119页 |
| ·确定实体结构转换规则 | 第114-115页 |
| ·XML实体匹配函数定义 | 第115页 |
| ·转换规则和实体匹配函数的学习过程 | 第115-119页 |
| ·XML半结构化实体的过滤算法 | 第119-121页 |
| ·XML半结构化实体匹配实验与结果分析 | 第121-123页 |
| ·实验数据与XML实体匹配方法介绍 | 第121-122页 |
| ·实验结果分析 | 第122-123页 |
| ·本章小节 | 第123-124页 |
| 7 结论与展望 | 第124-127页 |
| ·结论 | 第124-125页 |
| ·下一阶段工作展望 | 第125-127页 |
| 创新点摘要 | 第127-128页 |
| 参考文献 | 第128-136页 |
| 攻读博士学位期间发表学术论文与科研情况 | 第136-137页 |
| 致谢 | 第137-138页 |
| 作者简介 | 第138-140页 |