首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--存贮器论文

面向海量数据的云存储系统实现与应用研究

摘要第1-4页
Abstract第4-7页
1 绪论第7-14页
   ·研究背景及意义第7-10页
     ·网络时代的数据挑战第7页
     ·大数据时代的知识挑战第7-8页
     ·应对数据和知识的双重挑战第8-10页
   ·国内外研究现状第10-13页
   ·本文目录组织第13-14页
2 本文系统需求与架构第14-18页
   ·从数据获取知识的迫切需求第14-16页
   ·实现从海量数据到知识的三层架构第16-18页
3 海量数据存储子系统第18-29页
   ·存储子系统架构第18-19页
   ·用户管理模块第19-20页
   ·文件存储管理模块第20-29页
     ·分布式文件系统介绍第20-21页
     ·HDFS简介第21-22页
     ·GlusterFS简介第22-23页
     ·GlusterFS服务端第23-26页
     ·GlusterFS客户端第26-29页
4 海量信息检索子系统第29-40页
   ·检索子系统架构第29页
   ·信息收集模块第29-32页
     ·网络爬虫概述第29-30页
     ·Nutch简介第30-31页
     ·Nutch爬虫运行流程第31-32页
   ·信息索引模块第32-35页
     ·Nutch索引过程第32-33页
     ·Nutch抓取结果分析第33-35页
   ·信息查询模块第35-40页
     ·Lucene索引文件简介第36-37页
     ·倒排索引原理简介第37-38页
     ·Nutch搜索第38-40页
5 海量知识挖掘子系统第40-52页
   ·数据挖掘概述第40-41页
   ·文本聚类第41-45页
     ·中文分词第42页
     ·文本表示模型第42-44页
     ·文本相似度计算第44-45页
   ·聚类算法K-means第45-52页
     ·K-means算法流程第45-46页
     ·MapReduce编程模型第46-49页
     ·Mahout Kmeans算法实现第49-52页
6 实验与分析第52-64页
   ·实验流程设计第52-53页
   ·实验平台搭建第53-59页
     ·GlusterFS集群搭建第53-54页
     ·Hadoop集群搭建第54-56页
     ·Nutch环境搭建第56-58页
     ·Mahout环境搭建第58-59页
   ·实验结果展示第59-64页
7 总结与展望第64-66页
致谢第66-67页
参考文献第67-69页

论文共69页,点击 下载论文
上一篇:基于DSP的弹载计算机设计
下一篇:台式电脑机箱散热的数值模拟及优化