XML非完全结构查询处理中若干关键技术的研究
独创性声明 | 第1页 |
学位论文版权使用授权书 | 第4-5页 |
摘要 | 第5-7页 |
ABSTRACT | 第7-10页 |
目录 | 第10-14页 |
第一章 绪论 | 第14-18页 |
·研究背景 | 第14-15页 |
·本文工作 | 第15-18页 |
·研究动机 | 第15-16页 |
·研究内容 | 第16-17页 |
·本文组织结构 | 第17-18页 |
第二章 XML查询处理技术概述 | 第18-36页 |
·引言 | 第18页 |
·XML文档模型 | 第18-20页 |
·对象交换模型(OEM) | 第18-19页 |
·文档对象模型(DOM) | 第19-20页 |
·完全结构查询模型 | 第20-24页 |
·定义 | 第20-21页 |
·查询模型 | 第21-23页 |
·模型比较 | 第23-24页 |
·非完全结构查询模型 | 第24-29页 |
·定义 | 第24-26页 |
·查询模型 | 第26-28页 |
·XML文档检索 | 第26-27页 |
·FS查询扩展 | 第27-28页 |
·模型比较 | 第28-29页 |
·XML查询处理关键技术 | 第29-35页 |
·XML文档编码方法 | 第29-31页 |
·基于区间的编码 | 第29-30页 |
·基于路径的编码 | 第30-31页 |
·结构索引技术 | 第31-32页 |
·倒排索引技术 | 第32-33页 |
·有意义的NFS查询结果判断 | 第33-35页 |
·小结 | 第35-36页 |
第三章 基于模式和实体的NFS查询处理方法 | 第36-63页 |
·引言 | 第36-40页 |
·相关概念和模型 | 第36-37页 |
·NFS查询模型 | 第37-38页 |
·问题提出 | 第38-40页 |
·PE判断模型 | 第40-43页 |
·模式和实体 | 第41-42页 |
·PE规则 | 第42-43页 |
·基于PE模型的NFS查询方法 | 第43-48页 |
·XML编码 | 第43-44页 |
·等价模式和等价查询项 | 第44-45页 |
·PE索引 | 第45-46页 |
·12P倒排索引 | 第46-47页 |
·判别方法 | 第47-48页 |
·算法设计 | 第48-53页 |
·PE索引和I2P索引创建算法 | 第48-50页 |
·NFS查询执行算法 | 第50-53页 |
·实验分析 | 第53-62页 |
·实验设计 | 第53-56页 |
·实验结果 | 第56-61页 |
·性能分析和比较 | 第61-62页 |
·小结 | 第62-63页 |
第四章 文档聚类技术概述 | 第63-83页 |
·引言 | 第63-64页 |
·文档特征降维技术 | 第64-68页 |
·特征选取技术 | 第65-67页 |
·基于概念的降维技术 | 第67-68页 |
·基于传统聚类技术的文档聚类方法 | 第68-75页 |
·基于相似性的聚类方法 | 第69-71页 |
·基于模型的聚类方法 | 第71-73页 |
·基于划分的聚类方法 | 第73-74页 |
·基于层次的聚类方法 | 第74-75页 |
·面向文档特性的聚类方法 | 第75-81页 |
·潜在语义分析 | 第75-76页 |
·基于信息论的文档聚类方法 | 第76-80页 |
·双向聚类方法 | 第80-81页 |
·聚类质量评价方法 | 第81-82页 |
·小结 | 第82-83页 |
第五章 基于模型的非偏斜文档聚类方法 | 第83-103页 |
·引言 | 第83-84页 |
·相关工作 | 第84-86页 |
·基于多项式分布的硬聚类 | 第84-85页 |
·基于平衡约束的聚类方法 | 第85-86页 |
·聚类偏斜的分析 | 第86-89页 |
·相关概念与定义 | 第86-87页 |
·聚类偏斜产生的原因 | 第87-89页 |
·MMPClust聚类方法 | 第89-96页 |
·基于内容特性的簇模型 | 第89-91页 |
·估计样本选取 | 第91-94页 |
·MMPClust算法 | 第94-96页 |
·实验分析 | 第96-102页 |
·数据集 | 第96页 |
·实验方法与评价方法 | 第96-97页 |
·实验结果与分析 | 第97-102页 |
·小结 | 第102-103页 |
第六章 基于信息论的潜在概念获取与文档聚类方法 | 第103-123页 |
·引言 | 第103页 |
·相关工作 | 第103-105页 |
·模型提出 | 第105-108页 |
·词、潜在概念、文档和主题的关系 | 第105-106页 |
·模型描述 | 第106-108页 |
·模型求解 | 第108-116页 |
·给定β下目标函数求解 | 第108-113页 |
·潜在概念个数确定 | 第113-114页 |
·算法设计 | 第114-116页 |
·实验分析 | 第116-121页 |
·数据集和实验方法 | 第116-117页 |
·性能分析 | 第117-121页 |
·小结 | 第121-123页 |
第七章 总结与展望 | 第123-125页 |
·总结 | 第123-124页 |
·进一步工作 | 第124-125页 |
参考文献 | 第125-137页 |
致谢 | 第137-138页 |
攻博期间发表的文章 | 第138-139页 |
攻博期间参加和完成的科研项目 | 第139-140页 |
作者简介 | 第140页 |