XML非完全结构查询处理中若干关键技术的研究
| 独创性声明 | 第1页 |
| 学位论文版权使用授权书 | 第4-5页 |
| 摘要 | 第5-7页 |
| ABSTRACT | 第7-10页 |
| 目录 | 第10-14页 |
| 第一章 绪论 | 第14-18页 |
| ·研究背景 | 第14-15页 |
| ·本文工作 | 第15-18页 |
| ·研究动机 | 第15-16页 |
| ·研究内容 | 第16-17页 |
| ·本文组织结构 | 第17-18页 |
| 第二章 XML查询处理技术概述 | 第18-36页 |
| ·引言 | 第18页 |
| ·XML文档模型 | 第18-20页 |
| ·对象交换模型(OEM) | 第18-19页 |
| ·文档对象模型(DOM) | 第19-20页 |
| ·完全结构查询模型 | 第20-24页 |
| ·定义 | 第20-21页 |
| ·查询模型 | 第21-23页 |
| ·模型比较 | 第23-24页 |
| ·非完全结构查询模型 | 第24-29页 |
| ·定义 | 第24-26页 |
| ·查询模型 | 第26-28页 |
| ·XML文档检索 | 第26-27页 |
| ·FS查询扩展 | 第27-28页 |
| ·模型比较 | 第28-29页 |
| ·XML查询处理关键技术 | 第29-35页 |
| ·XML文档编码方法 | 第29-31页 |
| ·基于区间的编码 | 第29-30页 |
| ·基于路径的编码 | 第30-31页 |
| ·结构索引技术 | 第31-32页 |
| ·倒排索引技术 | 第32-33页 |
| ·有意义的NFS查询结果判断 | 第33-35页 |
| ·小结 | 第35-36页 |
| 第三章 基于模式和实体的NFS查询处理方法 | 第36-63页 |
| ·引言 | 第36-40页 |
| ·相关概念和模型 | 第36-37页 |
| ·NFS查询模型 | 第37-38页 |
| ·问题提出 | 第38-40页 |
| ·PE判断模型 | 第40-43页 |
| ·模式和实体 | 第41-42页 |
| ·PE规则 | 第42-43页 |
| ·基于PE模型的NFS查询方法 | 第43-48页 |
| ·XML编码 | 第43-44页 |
| ·等价模式和等价查询项 | 第44-45页 |
| ·PE索引 | 第45-46页 |
| ·12P倒排索引 | 第46-47页 |
| ·判别方法 | 第47-48页 |
| ·算法设计 | 第48-53页 |
| ·PE索引和I2P索引创建算法 | 第48-50页 |
| ·NFS查询执行算法 | 第50-53页 |
| ·实验分析 | 第53-62页 |
| ·实验设计 | 第53-56页 |
| ·实验结果 | 第56-61页 |
| ·性能分析和比较 | 第61-62页 |
| ·小结 | 第62-63页 |
| 第四章 文档聚类技术概述 | 第63-83页 |
| ·引言 | 第63-64页 |
| ·文档特征降维技术 | 第64-68页 |
| ·特征选取技术 | 第65-67页 |
| ·基于概念的降维技术 | 第67-68页 |
| ·基于传统聚类技术的文档聚类方法 | 第68-75页 |
| ·基于相似性的聚类方法 | 第69-71页 |
| ·基于模型的聚类方法 | 第71-73页 |
| ·基于划分的聚类方法 | 第73-74页 |
| ·基于层次的聚类方法 | 第74-75页 |
| ·面向文档特性的聚类方法 | 第75-81页 |
| ·潜在语义分析 | 第75-76页 |
| ·基于信息论的文档聚类方法 | 第76-80页 |
| ·双向聚类方法 | 第80-81页 |
| ·聚类质量评价方法 | 第81-82页 |
| ·小结 | 第82-83页 |
| 第五章 基于模型的非偏斜文档聚类方法 | 第83-103页 |
| ·引言 | 第83-84页 |
| ·相关工作 | 第84-86页 |
| ·基于多项式分布的硬聚类 | 第84-85页 |
| ·基于平衡约束的聚类方法 | 第85-86页 |
| ·聚类偏斜的分析 | 第86-89页 |
| ·相关概念与定义 | 第86-87页 |
| ·聚类偏斜产生的原因 | 第87-89页 |
| ·MMPClust聚类方法 | 第89-96页 |
| ·基于内容特性的簇模型 | 第89-91页 |
| ·估计样本选取 | 第91-94页 |
| ·MMPClust算法 | 第94-96页 |
| ·实验分析 | 第96-102页 |
| ·数据集 | 第96页 |
| ·实验方法与评价方法 | 第96-97页 |
| ·实验结果与分析 | 第97-102页 |
| ·小结 | 第102-103页 |
| 第六章 基于信息论的潜在概念获取与文档聚类方法 | 第103-123页 |
| ·引言 | 第103页 |
| ·相关工作 | 第103-105页 |
| ·模型提出 | 第105-108页 |
| ·词、潜在概念、文档和主题的关系 | 第105-106页 |
| ·模型描述 | 第106-108页 |
| ·模型求解 | 第108-116页 |
| ·给定β下目标函数求解 | 第108-113页 |
| ·潜在概念个数确定 | 第113-114页 |
| ·算法设计 | 第114-116页 |
| ·实验分析 | 第116-121页 |
| ·数据集和实验方法 | 第116-117页 |
| ·性能分析 | 第117-121页 |
| ·小结 | 第121-123页 |
| 第七章 总结与展望 | 第123-125页 |
| ·总结 | 第123-124页 |
| ·进一步工作 | 第124-125页 |
| 参考文献 | 第125-137页 |
| 致谢 | 第137-138页 |
| 攻博期间发表的文章 | 第138-139页 |
| 攻博期间参加和完成的科研项目 | 第139-140页 |
| 作者简介 | 第140页 |