首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

Deep Web查询中的不确定性问题研究

摘要第1-18页
ABSTRACT第18-21页
第1章 绪论第21-28页
   ·研究背景及意义第21-22页
   ·面临的问题第22-24页
   ·研究目标和内容第24-25页
   ·论文的贡献第25-27页
   ·组织结构第27-28页
第2章 相关研究第28-40页
   ·模式匹配第28-32页
     ·Deep Web中的模式匹配技术第28-29页
     ·模式匹配的不确定性第29-32页
   ·查询接口的集成第32-33页
   ·在集成接口上的查询转换第33-34页
     ·Deep Web接口间的查询转换第33-34页
     ·查询转换的不确定性第34页
   ·重复记录的处理第34-36页
     ·Deep Web中重复记录处理的研究第34-35页
     ·重复记录处理的不确定性第35-36页
   ·基于用户偏好的查询第36-39页
     ·转化为单目标优化问题的方法——采用得分函数的top-k技术第36-38页
     ·多目标优化的方法——skyline技术第38-39页
   ·小结第39-40页
第3章 接口集成与概率接口的映射第40-65页
   ·引言第40-41页
   ·工作过程第41-42页
   ·多集成接口与接口的概率映射的定义第42-45页
     ·问题提出第42-44页
     ·多集成接口与接口的概率映射的相关定义第44-45页
   ·集成接口中属性集的生成第45-54页
     ·属性间相似度的计算第46-49页
       ·语法上相似性的计算第46页
       ·值域相似性的计算第46-48页
       ·语义相似性的计算第48-49页
     ·集成接口上属性集的生成第49-54页
       ·利用聚类集成生成属性集的过程第49-50页
       ·用于生成待集成的聚类成员的聚类算法第50-51页
       ·共识矩阵的建立第51-53页
       ·利用聚类集成生成单一集成接口属性集的算法第53-54页
     ·集成接口中属性集其他特征的确定第54页
   ·接口上的概率映射第54-58页
     ·属性间匹配概率的计算第54-56页
     ·映射组合选择第56-58页
       ·Top-k个映射组合的选择第56-58页
       ·对映射组合计算概率值第58页
   ·实验第58-65页
     ·数据集第58-59页
     ·接口集成方法的性能评估第59-61页
     ·本文接口集成的方法与已有方法的比较第61页
     ·形成概率映射的算法的性能评估第61-63页
     ·概率映射的方法与已有方法的比较第63-65页
第4章 基于概率映射的查询处理第65-88页
   ·引言第65-66页
   ·工作过程第66-67页
   ·Deep Web中基于概率映射的查询语义第67-69页
     ·Deep Web集成中概率映射下查询的语义第67-69页
     ·概率映射下查询结果求解算法第69页
   ·查询转换的问题定义第69-74页
     ·查询转换问题第69-71页
     ·与查询有关的接口属性特征第71-72页
     ·查询转换的定义第72-74页
   ·谓词映射的实现第74-80页
     ·物化方法求解最小包含的谓词映射的过程第74-76页
     ·最小包含的谓词映射求解算法第76-78页
     ·谓词物化结果的计算第78-80页
       ·文本型的处理第78-79页
       ·数值型和日期型的处理第79-80页
   ·查询重写的实现第80-83页
     ·查询重写的原则第80-81页
     ·查询重写算法第81-83页
   ·实验第83-88页
     ·数据集第83页
     ·谓词映射生成算法与已有算法在准确性和完整性上的比较第83-85页
     ·谓词映射生成和查询转换算法与已有算法在运行效率上的比较第85-86页
     ·基于概率映射,在局部接口上形成查询的性能评估第86-88页
第5章 具有隶属模糊性的重复记录处理第88-141页
   ·引言第88-90页
   ·重复记录处理的概率数据生成过程第90-93页
     ·重复记录处理的概率数据定义第90-91页
     ·生成过程第91-93页
   ·记录间相似度的计算第93-95页
     ·计算记录相似度时概率因子的处理第93-94页
     ·数据字段上的比较方法第94-95页
   ·对重复数据的聚类构建重复可能集第95-103页
     ·大规模数据下的分块第95-97页
     ·分块中的聚类过程第97-99页
     ·聚类准确性的保证第99-102页
     ·聚类中元素概率的计算第102-103页
   ·实验第103-109页
     ·数据集第103页
     ·大规模数据集上采用分块算法前后的性能评估第103-105页
     ·分块算法中参数对算法的影响第105页
     ·本文所用聚类算法与已有聚类算法的性能比较第105-106页
     ·本文所用聚类算法与已有聚类算法运行时间的比较第106-107页
     ·概率分配算法与已有方法的性能比较第107-109页
 第6章 具有概率的重复记录集上基于用户偏好的查询第109-141页
   ·引言第109-111页
   ·不确定数据集上的Top-K查询第111-113页
     ·可能世界的定义第111-112页
     ·不确定数据上的Top-k查询的定义第112-113页
   ·不确定数据集上单目标优化的Top-k算法第113-126页
     ·Global-Topk查询语义第113-114页
     ·不确定的实体包含单一可能的实例情况下的Global-Topk求解第114-117页
       ·状态的概率第114-116页
       ·简化模型下的Global-Topk求解算法第116-117页
     ·不确定的实体包含非单一可能的实例情况下的Global-Topk求解第117-122页
       ·简化模型下的Global-Topk求解算法第117-121页
       ·Top-k个Global-Topk概率值求解算法第121页
       ·不确定的实体中部分可能的实例的选择第121-122页
     ·实验第122-126页
       ·数据集及用于比较的算法第123页
       ·与已有算法在数据规模及不确定实体内可能实例个数两因素的比较第123-125页
       ·与已有算法在k值的影响的比较第125-126页
   ·不确定性数据集上多目标优化的Top-k skyline算法第126-141页
     ·不确定数据集上的skyline基本定义第126-128页
     ·Top-k个skyline概率求解策略第128-135页
       ·利用MinSky策略进行过滤和修剪第129-133页
       ·利用MaxSky策略寻找阈值第133-135页
     ·Top-k个skyline概率求解算法描述第135-137页
     ·实验第137-141页
       ·数据集与用于比较的算法第137-138页
       ·与已有算法在运行效率的比较第138页
       ·与已有方法在修剪能力的比较第138-139页
       ·与已有算法在top-k中k的个数因素的比较第139-140页
       ·与已有算法在维度因素的比较第140-141页
第7章 总结与展望第141-143页
   ·总结第141-142页
   ·展望第142-143页
参考文献第143-158页
致谢第158-160页
攻读学位期间发表的学术论文目录第160-162页
攻读学位期间参与科研项目情况第162-163页
攻读学位期间获奖情况第163-165页
学位论文评阅及答辩情况表第165-167页
外文论文第167-187页

论文共187页,点击 下载论文
上一篇:软件体系结构中状态方面的编织研究
下一篇:无线传感器网络分簇算法研究