海量文件系统元数据查询方法与技术

摘要	第1-5页
Abstract	第5-11页
第1章引言	第11-28页
·海量文件系统概述	第11-15页
·海量文件系统发展趋势	第11-12页
·日益严峻的管理挑战	第12-15页
·元数据查询概述	第15-24页
·元数据查询的分类和典型示例	第17-20页
·研究高效元数据查询方法之必要性	第20页
·元数据查询的特性	第20-21页
·元数据查询的困难和挑战	第21-24页
·本文的主要研究内容和主要贡献	第24-28页
·研究什么和不研究什么	第24-26页
·本文的主要工作	第26-27页
·论文的组织结构和各章内容简介	第27-28页
第2章相关工作	第28-42页
·文件系统元数据和负载分析	第28-31页
·基于文件系统快照的元数据属性静态特征分析	第28-29页
·基于工作负载跟踪日志的文件系统行为动态特征分析	第29-31页
·元数据抓取与同步	第31-34页
·元数据抓取与同步问题之特点及其主要成因	第31-32页
·国内外主要解决方案及其局限性	第32-34页
·查询数据集之组织方式和索引技术	第34-37页
·面向结构化查询的关系型数据的数据组织方式	第34-36页
·面向非结构化查询的搜索引擎倒排索引技术	第36-37页
·现有的元数据查询解决方案	第37-40页
·基于遍历元数据查询	第37页
·桌面搜索和企业级搜索	第37-38页
·基于 KD-Tree 的 Spyglass	第38-39页
·基于抽样的 Glance	第39-40页
·相关工作小结	第40-42页
第3章文件系统元数据特征分析及其变化模式	第42-55页
·本章概述	第42-43页
·数据集与分析方法	第43-45页
·数据集	第43页
·术语定义	第43-44页
·如何识别目录	第44-45页
·时间相关的属性	第45-49页
·变化频度	第45-47页
·变化间隔	第47-48页
·变化频度和变化间隔的相关性	第48-49页
·名字空间相关的属性	第49-52页
·空间局部性	第49-51页
·目录深度	第51-52页
·文件类型	第52-54页
·本章小结	第54-55页
第4章基于选择性扫描的元数据抓取与同步方法SmartScan	第55-77页
·本章概述	第55-56页
·动机和理念	第56-58页
·元数据变化特征	第58-63页
·数据收集	第58-59页
·文件系统的变化分类	第59-60页
·元数据变化的空间局部性	第60-61页
·元数据变化的时间局部性	第61-62页
·DTSD 对个别变化的预测	第62-63页
·SmartScan 系统的设计与实现	第63-66页
·设计概要	第63页
·体系结构	第63-64页
·扫描目录选择	第64-65页
·扫描策略	第65-66页
·原型系统实现	第66页
·实验方法与结果	第66-75页
·实验环境及设置	第67页
·时新性和覆盖率	第67-70页
·扫描性能	第70-71页
·查询结果偏差	第71-75页
·本章小结	第75-77页
第5章基于文件系统注入的元数据变化跟踪方法FastDu	第77-90页
·本章概述	第77-78页
·背景和动机	第78-80页
·FastDu 的典型应用场景目录统计信息收集	第78-79页
·主要设计选择	第79-80页
·FastDu 的设计和实现	第80-84页
·体系结构	第80-81页
·接口与核心数据结构	第81-82页
·预建数据库的延迟更新策略	第82-83页
·修改缓冲机制	第83-84页
·原型系统实现	第84页
·实验方法与结果	第84-88页
·实验环境及设置	第85页
·性能	第85-86页
·对文件系统性能的影响	第86-88页
·本章小结	第88-90页
第6章元数据副本组织方式和并行扫描方法	第90-112页
·本章概述	第90-91页
·面向文件标准属性的编码方式	第91-95页
·属性值分布的近邻相似性和邻居差异编码	第91-94页
·属性值分布的不均衡性和文件大小变长编码	第94-95页
·元数据副本划分及其数据组织方式	第95-100页
·基于子森林的元数据副本划分	第95-97页
·MDFile 文件格式	第97-100页
·宽松深度优先递归遍历模型和并行扫描算法	第100-105页
·并行遍历模型的语义和优势	第100-101页
·算法的核心程序接口	第101-102页
·宽松深度优先并行扫描算法	第102-105页
·实验方法与结果	第105-110页
·实验环境及设置	第105-106页
·数据压缩比	第106页
·遍历性能	第106-109页
·算法可扩展性	第109-110页
·本章小结	第110-112页
第7章可扩展的元数据查询原型系统FsInsight	第112-127页
·本章概述	第112-113页
·FsInsight 系统	第113-115页
·实体化视图	第115-120页
·系统视图	第115-116页
·自定义视图	第116页
·视图的定义和实现	第116-120页
·实验方法与结果	第120-125页
·实验环境及设置	第121页
·查询性能	第121-124页
·实体化视图的更新性能	第124-125页
·本章小结	第125-127页
第8章总结及进一步工作	第127-132页
·总结	第127-130页
·进一步工作	第130-132页
参考文献	第132-140页
致谢	第140-141页
个人简历、在学期间发表的学术论文与研究成果	第141-143页