首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--存贮器论文

基于Hadoop的OA论文存储及检索策略

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-18页
   ·研究的背景和意义第10-11页
   ·国内外研究现状第11-15页
     ·OA 期刊论文存储特点第11-12页
     ·基于 Hadoop 的小文件存储的国内外研究现状第12-15页
   ·研究内容及主要工作第15-16页
   ·论文组织结构第16-18页
第2章 Hadoop 的分布式模型及文件索引的相关研究第18-29页
   ·Hadoop 分布式存储模型第18-23页
     ·HDFS 分布式存储的架构第19-20页
     ·HDFS 的工作原理第20-21页
     ·HDFS 的读写操作第21-23页
   ·Hadoop 分布式计算模型第23-27页
     ·Hadoop 分布式计算 MapReduce 的原理第24-25页
     ·MapReduce 工作机制第25-27页
   ·关于文件索引机制的相关研究第27-28页
   ·本章小结第28-29页
第3章 基于 Hadoop 的 OA 论文存储策略第29-39页
   ·针对 OA 论文的 Hadoop 小文件合并策略第29-30页
   ·基于 MOB+树对合并的小文件建立索引第30-37页
     ·B+的索引原理第30-31页
     ·基于 MoB+树的 OA 期刊的小文件合并索引机制第31-35页
     ·基于 MoB+树的 OA 期刊的小文件查询第35-37页
   ·本章小结第37-39页
第4章 基于 Lucene 的 OA 论文元数据排序策略第39-46页
   ·基于 Lucene 检索评分排序的算法第39-41页
     ·TF-IDF 算法第39-40页
     ·矢量模型第40-41页
   ·通过 Lucene 搜索关键字的权重第41-45页
     ·Lucene 的原生排序算法第41-42页
     ·根据 OA 期刊论文的元数据建立排序策略第42-44页
     ·算法的并行实现第44-45页
   ·本章小结第45-46页
第5章 实验与性能分析第46-59页
   ·实验数据和实验环境第46-47页
     ·实验数据集第46页
     ·实验环境第46-47页
   ·OA 期刊论文存储的实验评价指标第47-48页
   ·基于 MOB+树的文件索引算法的实验结果与分析第48-53页
     ·对比算法简介第49-50页
     ·内存占有量对比第50-52页
     ·读取速率对比第52-53页
   ·基于 MapReduce 的 OA 论文排序算法的实验结果与分析第53-57页
     ·Lucene 的 OA 论文排序算法简介第53-54页
     ·实验和结果分析第54-57页
   ·本章小结第57-59页
结论第59-61页
参考文献第61-64页
攻读硕士学位期间承担的科研任务与主要成果第64-65页
致谢第65-66页
作者简介第66页

论文共66页,点击 下载论文
上一篇:数据中心动力环境监控系统的研究与设计
下一篇:基于社区的影响最大化算法研究