首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

海量文件系统元数据查询方法与技术

摘要第1-5页
Abstract第5-11页
第1章 引言第11-28页
   ·海量文件系统概述第11-15页
     ·海量文件系统发展趋势第11-12页
     ·日益严峻的管理挑战第12-15页
   ·元数据查询概述第15-24页
     ·元数据查询的分类和典型示例第17-20页
     ·研究高效元数据查询方法之必要性第20页
     ·元数据查询的特性第20-21页
     ·元数据查询的困难和挑战第21-24页
   ·本文的主要研究内容和主要贡献第24-28页
     ·研究什么和不研究什么第24-26页
     ·本文的主要工作第26-27页
     ·论文的组织结构和各章内容简介第27-28页
第2章 相关工作第28-42页
   ·文件系统元数据和负载分析第28-31页
     ·基于文件系统快照的元数据属性静态特征分析第28-29页
     ·基于工作负载跟踪日志的文件系统行为动态特征分析第29-31页
   ·元数据抓取与同步第31-34页
     ·元数据抓取与同步问题之特点及其主要成因第31-32页
     ·国内外主要解决方案及其局限性第32-34页
   ·查询数据集之组织方式和索引技术第34-37页
     ·面向结构化查询的关系型数据的数据组织方式第34-36页
     ·面向非结构化查询的搜索引擎倒排索引技术第36-37页
   ·现有的元数据查询解决方案第37-40页
     ·基于遍历元数据查询第37页
     ·桌面搜索和企业级搜索第37-38页
     ·基于 KD-Tree 的 Spyglass第38-39页
     ·基于抽样的 Glance第39-40页
   ·相关工作小结第40-42页
第3章 文件系统元数据特征分析及其变化模式第42-55页
   ·本章概述第42-43页
   ·数据集与分析方法第43-45页
     ·数据集第43页
     ·术语定义第43-44页
     ·如何识别目录第44-45页
   ·时间相关的属性第45-49页
     ·变化频度第45-47页
     ·变化间隔第47-48页
     ·变化频度和变化间隔的相关性第48-49页
   ·名字空间相关的属性第49-52页
     ·空间局部性第49-51页
     ·目录深度第51-52页
   ·文件类型第52-54页
   ·本章小结第54-55页
第4章 基于选择性扫描的元数据抓取与同步方法SmartScan第55-77页
   ·本章概述第55-56页
   ·动机和理念第56-58页
   ·元数据变化特征第58-63页
     ·数据收集第58-59页
     ·文件系统的变化分类第59-60页
     ·元数据变化的空间局部性第60-61页
     ·元数据变化的时间局部性第61-62页
     ·DTSD 对个别变化的预测第62-63页
   ·SmartScan 系统的设计与实现第63-66页
     ·设计概要第63页
     ·体系结构第63-64页
     ·扫描目录选择第64-65页
     ·扫描策略第65-66页
     ·原型系统实现第66页
   ·实验方法与结果第66-75页
     ·实验环境及设置第67页
     ·时新性和覆盖率第67-70页
     ·扫描性能第70-71页
     ·查询结果偏差第71-75页
   ·本章小结第75-77页
第5章 基于文件系统注入的元数据变化跟踪方法FastDu第77-90页
   ·本章概述第77-78页
   ·背景和动机第78-80页
     ·FastDu 的典型应用场景目录统计信息收集第78-79页
     ·主要设计选择第79-80页
   ·FastDu 的设计和实现第80-84页
     ·体系结构第80-81页
     ·接口与核心数据结构第81-82页
     ·预建数据库的延迟更新策略第82-83页
     ·修改缓冲机制第83-84页
     ·原型系统实现第84页
   ·实验方法与结果第84-88页
     ·实验环境及设置第85页
     ·性能第85-86页
     ·对文件系统性能的影响第86-88页
   ·本章小结第88-90页
第6章 元数据副本组织方式和并行扫描方法第90-112页
   ·本章概述第90-91页
   ·面向文件标准属性的编码方式第91-95页
     ·属性值分布的近邻相似性和邻居差异编码第91-94页
     ·属性值分布的不均衡性和文件大小变长编码第94-95页
   ·元数据副本划分及其数据组织方式第95-100页
     ·基于子森林的元数据副本划分第95-97页
     ·MDFile 文件格式第97-100页
   ·宽松深度优先递归遍历模型和并行扫描算法第100-105页
     ·并行遍历模型的语义和优势第100-101页
     ·算法的核心程序接口第101-102页
     ·宽松深度优先并行扫描算法第102-105页
   ·实验方法与结果第105-110页
     ·实验环境及设置第105-106页
     ·数据压缩比第106页
     ·遍历性能第106-109页
     ·算法可扩展性第109-110页
   ·本章小结第110-112页
第7章 可扩展的元数据查询原型系统FsInsight第112-127页
   ·本章概述第112-113页
   ·FsInsight 系统第113-115页
   ·实体化视图第115-120页
     ·系统视图第115-116页
     ·自定义视图第116页
     ·视图的定义和实现第116-120页
   ·实验方法与结果第120-125页
     ·实验环境及设置第121页
     ·查询性能第121-124页
     ·实体化视图的更新性能第124-125页
   ·本章小结第125-127页
第8章 总结及进一步工作第127-132页
   ·总结第127-130页
   ·进一步工作第130-132页
参考文献第132-140页
致谢第140-141页
个人简历、在学期间发表的学术论文与研究成果第141-143页

论文共143页,点击 下载论文
上一篇:部分冗余消除优化的SSA算法研究
下一篇:文档摘要算法的研究与应用