首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--存贮器论文

面向海量URL数据存取的快速文件系统

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-16页
   ·课题来源及研究的目的和意义第10-11页
     ·课题来源第10页
     ·研究意义第10-11页
   ·国内外相关技术发展现状第11-14页
     ·URL 管理的技术现状第11-13页
     ·文件系统的技术现状第13-14页
   ·本文的主要内容第14-15页
   ·本文的结构安排第15-16页
第2章 Web 爬虫中海量URL 数据的存取操作分析第16-23页
   ·引言第16页
   ·web 爬虫对海量URL 的存取需求第16-19页
     ·web 爬虫的相关术语诠释第16-17页
     ·web 爬虫的流程第17-18页
     ·web 爬虫对URL 的存取需求第18-19页
   ·基于关系数据库的海量URL 存取方法分析第19-20页
   ·海量URL 操作的性能瓶颈第20-22页
     ·内存数据库、嵌入式数据库、关系数据库的对比第20-21页
     ·快速文件系统模型第21-22页
   ·本章小结第22-23页
第3章 快速文件系统的逻辑存取模型第23-41页
   ·引言第23页
   ·海量URL 的去重技术第23-24页
     ·基于哈希的去重技术第23页
     ·哈希函数的选择实验第23-24页
   ·海量URL 的索引技术第24-28页
     ·哈希索引技术第25-26页
     ·Trie 索引第26页
     ·B 树索引第26-28页
   ·基于优化B+树的快速文件系统逻辑存取模型第28-38页
     ·URL 及其附属信息的存储结构第28页
     ·逻辑存取模型第28-29页
     ·优化B+树索引第29-35页
     ·优化B+树的实验分析第35-38页
   ·并发存取模型设计第38-40页
     ·锁机制第38-39页
     ·共享缓冲区并发模型第39-40页
   ·本章小结第40-41页
第4章 快速文件系统的物理存取模型及I/O 优化第41-52页
   ·引言第41页
   ·海量URL 的物理存取模型第41-44页
     ·URL 的物理存取结构第41-42页
     ·快速文件系统的物理存取模型第42-43页
     ·外存地址的映射关系第43-44页
   ·海量URL 的缓存技术第44-47页
     ·快速文件系统的缓存策略第44-46页
     ·缓存命中率实验分析第46-47页
   ·I/O 优化第47-51页
     ·I/O 优化原理第47-49页
     ·I/O 优化实验分析第49-51页
   ·本章小结第51-52页
第5章 面向Web 爬虫的海量URL 快速文件系统设计与实现第52-59页
   ·引言第52页
   ·快速文件系统的设计目标第52页
   ·系统的总体设计第52-54页
   ·系统的详细设计第54-57页
     ·去重模块第54页
     ·索引管理模块第54-55页
     ·记录管理模块第55-56页
     ·缓存管理模块第56-57页
     ·页面调度模块第57页
   ·实验结果和对比第57-58页
   ·本章小结第58-59页
结论第59-60页
参考文献第60-64页
致谢第64页

论文共64页,点击 下载论文
上一篇:基于GCC的ARCA3的编译器移植
下一篇:音频IP验证平台的设计与开发