致谢 | 第1-5页 |
摘要 | 第5-6页 |
Abstract | 第6-12页 |
第一部分 PBASE/2并行数据库系统总论 | 第12-35页 |
第一章 并行数据库系统——高性能数据库系统的未来 | 第12-20页 |
§1.1.驱动并行数据库系统研制的原因 | 第12-15页 |
§1.2.本文的研究目标和内容 | 第15-20页 |
§1.2.1.并行查询执行的研究内容 | 第15-16页 |
§1.2.2.并行查询优化的研究内容 | 第16-17页 |
§1.2.3.本文的创新点 | 第17-20页 |
第二章 并行数据库系统PBASE/2 | 第20-26页 |
§2.1.PBASE/2的开发背景简介 | 第20页 |
§2.2.PBASE/2的抽象并行计算模型(APCM) | 第20-22页 |
§2.3.PBASE/2的体系结构 | 第22-26页 |
§2.3.1.前端主结点 | 第23-25页 |
§2.3.2.后端执行引擎 | 第25-26页 |
第三章 并行查询执行计划表示模型 | 第26-35页 |
§3.1.数据流树和并行数据流图 | 第26-28页 |
§3.2.并行查询执行计划的标注信息 | 第28-29页 |
§3.3.PBASE/2的并行查询执行计划表示模型 | 第29-35页 |
第二部分 并行查询执行引擎—虚拟数据库机 | 第35-75页 |
第四章 虚拟处理机和操作 | 第38-41页 |
§4.1.操作 | 第38-39页 |
§4.2.虚拟处理机结构 | 第39-41页 |
第五章 虚拟数据总线和流 | 第41-51页 |
§5.1.流的定义 | 第41-43页 |
§5.2.虚拟数据总线的流管理机制 | 第43-48页 |
§5.2.1.基本流 | 第43-45页 |
§5.2.2.支持操作内并行的流 | 第45-46页 |
§5.2.3.跨结点传输的流 | 第46-48页 |
§5.3.流的操纵接口 | 第48-51页 |
第六章 虚拟主存和虚表 | 第51-73页 |
§6.1.几种典型的缓冲区管理策略 | 第51-54页 |
§6.1.1 简单的缓冲区管理算法 | 第51-52页 |
§6.1.2.基于页面类型划分的缓冲策略 | 第52页 |
§6.1.3.“热集”模型 | 第52-53页 |
§6.1.4.面向查询存取模式的缓冲策略 | 第53-54页 |
§6.2.PBASE/2的虚拟主存 | 第54-55页 |
§6.3.PBASE/2的查询行为模型和虚表缓冲策略 | 第55-64页 |
§6.3.1.磁盘虚表的数据存取模式 | 第55-59页 |
§6.3.2.主存虚表的数据存取模式 | 第59-64页 |
§6.4.操作算法的数据存取模式选择 | 第64-68页 |
§6.4.1.顺序执行时操作算法对磁盘虚表的数据存取模式 | 第64-65页 |
§6.4.2.顺序执行时操作算法对主存虚表的数据存取模式 | 第65-66页 |
§6.4.3.并行执行时操作算法对虚表的数据存取模式 | 第66-68页 |
§6.5.PBASE/2基于QBM的缓冲管理策略 | 第68-73页 |
§6.5.1.缓冲区资源使用级别 | 第68-70页 |
§6.5.2.缓冲区管理的数据结构 | 第70-71页 |
§6.5.3.缓冲区页面的释放算法 | 第71页 |
§6.5.4.缓冲区页面的申请算法 | 第71-73页 |
第二部分小结 | 第73-75页 |
第三部分 并行查询优化 | 第75-136页 |
第七章 问题定义 | 第75-83页 |
§7.1.搜索空间 | 第76-79页 |
§7.1.1.顺序优化的搜索空间 | 第76-77页 |
§7.1.2.PBASE/2并行查询优化的搜索空间 | 第77-78页 |
§7.1.3.限制搜索空间规模的启发式规则 | 第78-79页 |
§7.2.并行查询优化的代价模型 | 第79-83页 |
第八章 PBASE/2的两阶段查询优化策略 | 第83-92页 |
§8.1.经典的两阶段优化方法 | 第83-84页 |
§8.2.PBASE/2的两阶段优化 | 第84-92页 |
§8.2.1.数据分片策略对操作间偏序关系的影响 | 第85-87页 |
§8.2.2.数据分片策略对操作算法的影响 | 第87-88页 |
§8.2.3.两阶段优化的悖论 | 第88-90页 |
§8.2.4.PBASE/2优化阶段的划分 | 第90-92页 |
第九章 PBASE/2基于代价的顺序优化 | 第92-114页 |
§9.1.顺序优化的代价模型 | 第92-103页 |
§9.1.1.代价指标 | 第92-93页 |
§9.1.2.基本代价模型 | 第93-94页 |
§9.1.3.考虑流的顺序性的代价模型 | 第94-97页 |
§9.1.4.考虑流的数据分片策略的代价模型 | 第97-103页 |
§9.2.PBASE/2顺序优化的搜索空间 | 第103-107页 |
§9.2.1.线性树 | 第103-106页 |
§9.2.2.连接图 | 第106-107页 |
§9.3.PBASE/2顺序优化的搜索策略 | 第107-114页 |
§9.3.1.关于动态规划裁剪指标的讨论 | 第108-110页 |
§9.3.2.PBASE/2顺序优化的裁剪指标 | 第110-111页 |
§9.3.3.PBASE/2顺序优化的动态规划算法 | 第111-114页 |
第十章 并行化 | 第114-134页 |
§10.1.并行化的目标——多资源负载平衡 | 第114-118页 |
§10.1.1 多资源负载平衡的定义 | 第115-116页 |
§10.1.2.影响资源负载平衡的主要因素 | 第116-118页 |
§10.2.任务划分 | 第118-121页 |
§10.2.1.任务的划分规则 | 第118-120页 |
§10.2.2.任务树 | 第120-121页 |
§10.3.并行化的代价模型 | 第121-123页 |
§10.4.并行化的搜索策略 | 第123-128页 |
§10.4.1.并行化的搜索空间 | 第123-126页 |
§10.4.2.并行化算法 | 第126-128页 |
§10.5.任务调度 | 第128-134页 |
§10.5.1.多任务的多资源负载平衡 | 第129-130页 |
§10.5.2.系统资源向量和系统负载平衡因子 | 第130-131页 |
§10.5.3.任务调度算法 | 第131-134页 |
第三部分小结 | 第134-136页 |
附录A:PBASE/2的实验性能 | 第136-140页 |
§A.1.单结点PBASE/2与SYBASE性能测试对比 | 第136-138页 |
§A.2.PBASE/2的加速比 | 第138-140页 |
§A.2.1.测试环境 | 第138页 |
§A.2.2.测试集 | 第138-139页 |
§A.2.3.测试结果 | 第139-140页 |
附录B:中间结果大小的估计 | 第140-145页 |
§B.1.统计信息 | 第140-141页 |
§B.2.操作的结果大小估计 | 第141-145页 |
参考文献 | 第145-150页 |
【作者简历】 | 第150页 |
【攻读博士学位期间发表的主要论文】 | 第150-151页 |
【参加的主要科研项目】 | 第151页 |
【出版的主要著作】 | 第151页 |