摘要 | 第1-6页 |
Abstract | 第6-13页 |
1 绪论 | 第13-27页 |
·研究背景 | 第13-16页 |
·信用的概念与信用信息不对称问题 | 第13-14页 |
·征信的定义 | 第14页 |
·征信系统的产生与功能 | 第14-16页 |
·问题的提出 | 第16-21页 |
·实体与实体匹配的定义 | 第16页 |
·征信系统中实体匹配运算的特点 | 第16-20页 |
·研究问题的抽象与研究目标 | 第20-21页 |
·理论与现实意义 | 第21-22页 |
·现实意义 | 第21-22页 |
·理论意义 | 第22页 |
·研究的结构与框架 | 第22-27页 |
·实体匹配的处理流程 | 第22-24页 |
·论文的研究框架 | 第24-27页 |
2 实体匹配方法文献综述 | 第27-38页 |
·字符串相似度计算 | 第27-31页 |
·基于距离的字符串相似度算法 | 第27-29页 |
·基于Token的字符串相似度算法 | 第29-31页 |
·相似实体的匹配算法 | 第31-36页 |
·排序&合并算法 | 第32-33页 |
·建索引的方法 | 第33-34页 |
·机器学习的方法 | 第34-36页 |
·记录簇与XML半结构化文档匹配 | 第36-38页 |
3 基于关联token的自适应字符串相似度计算方法 | 第38-57页 |
·各种数据类型属性值相似度计算方法介绍 | 第38-39页 |
·征信系统中字符型属性相似度计算存在的问题 | 第39-42页 |
·自适应字符串相似度计算方法的原理 | 第42-48页 |
·基于关联token字符串相似度算法的总体框架 | 第43页 |
·关联操作的定义 | 第43-45页 |
·相似度函数学习机设计 | 第45-48页 |
·改进字符串相似度计算方法 | 第48-52页 |
·token关联操作集的细化 | 第49页 |
·考虑词频的字符串相似度计算 | 第49-52页 |
·实验结果与分析 | 第52-56页 |
·实验数据介绍 | 第52页 |
·实验方法与评价指标说明 | 第52-53页 |
·实验结果与分析 | 第53-56页 |
·本章小结 | 第56-57页 |
4 有标识字段的实体匹配方法 | 第57-79页 |
·征信系统中影响匹配运算效率的问题点 | 第58-60页 |
·自适应联合分组模型 | 第60-65页 |
·联合分组模型设计 | 第61-63页 |
·分组式集的析取式的分析 | 第63-65页 |
·分组式集的析取范式分析 | 第65页 |
·自适应联合分组模型的求解 | 第65-69页 |
·采用析取式的联合分组模型求解 | 第66-67页 |
·采用析取范式的联合分组模型求解 | 第67-68页 |
·整体分组式的应用 | 第68-69页 |
·基于LSVM的有标识字段实体记录匹配方法 | 第69-72页 |
·LSVM算法的原理 | 第69-71页 |
·求解有标识字段实体记录的匹配函数 | 第71-72页 |
·自适应实体记录匹配方法框架 | 第72-74页 |
·实验结果与分析 | 第74-78页 |
·实验数据介绍 | 第74页 |
·实验方法与评价指标介绍 | 第74-75页 |
·联合分组模型的实验分析 | 第75-77页 |
·LSVM实体匹配方法的实验分析 | 第77-78页 |
·本章小结 | 第78-79页 |
5 无标识字段的自动实体匹配方法 | 第79-102页 |
·自动实体匹配操作需解决的问题 | 第79-81页 |
·基于主动学习的半监督式实体匹配方法 | 第81-89页 |
·训练样本的聚类 | 第82-85页 |
·匹配函数主动学习算法 | 第85-89页 |
·两阶段无监督式的自动实体匹配方法 | 第89-97页 |
·自动构建初始训练样本集 | 第89-92页 |
·基于迭代SVM的匹配函数自学习算法 | 第92-96页 |
·两阶段无监督式机器学习的实体匹配方法框架 | 第96-97页 |
·实验结果与分析 | 第97-101页 |
·实验方法与数据介绍 | 第97-98页 |
·实验结果分析 | 第98-101页 |
·本章小结 | 第101-102页 |
6 记录簇实体和XML半结构化实体的匹配方法 | 第102-124页 |
·记录簇实体与XML半结构化实体匹配的技术难点 | 第102-105页 |
·记录簇实体 | 第102-104页 |
·XML半结构化实体 | 第104-105页 |
·记录簇实体匹配模型的构建 | 第105-108页 |
·记录簇匹配模式定义 | 第105-106页 |
·记录簇匹配的数学模型 | 第106-108页 |
·记录簇实体上下界匹配算法设计 | 第108-111页 |
·相似度上下界的推导 | 第108-109页 |
·上下界匹配算法描述 | 第109-111页 |
·记录簇匹配方法的实验与结果分析 | 第111-113页 |
·记录簇实体匹配方法与实验数据介绍 | 第111-112页 |
·实验结果分析 | 第112-113页 |
·XML半结构化实体的匹配方法 | 第113-119页 |
·确定实体结构转换规则 | 第114-115页 |
·XML实体匹配函数定义 | 第115页 |
·转换规则和实体匹配函数的学习过程 | 第115-119页 |
·XML半结构化实体的过滤算法 | 第119-121页 |
·XML半结构化实体匹配实验与结果分析 | 第121-123页 |
·实验数据与XML实体匹配方法介绍 | 第121-122页 |
·实验结果分析 | 第122-123页 |
·本章小节 | 第123-124页 |
7 结论与展望 | 第124-127页 |
·结论 | 第124-125页 |
·下一阶段工作展望 | 第125-127页 |
创新点摘要 | 第127-128页 |
参考文献 | 第128-136页 |
攻读博士学位期间发表学术论文与科研情况 | 第136-137页 |
致谢 | 第137-138页 |
作者简介 | 第138-140页 |