首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

应用于海量数据处理分析的云计算平台搭建研究

摘要第1-5页
ABSTRACT第5-8页
1 绪论第8-10页
   ·论文研究背景第8-9页
   ·主要研究内容第9页
   ·论文研究目标第9-10页
2 云计算系统关键技术第10-16页
   ·计算系统模型简介第10-14页
     ·Google文件系统GFS第10-12页
     ·IBM的蓝云第12-13页
     ·Apache的Hadoop第13-14页
   ·分布式系统基本算法第14-16页
     ·存储算法Bigtable第14页
     ·MapReduce算法第14-16页
3 Hadoop的整体架构第16-22页
   ·Hadoop分布式文件系统(HDFS)第16-18页
     ·NameNode和DataNode第17页
     ·命名空间第17页
     ·数据复制第17-18页
     ·通信协议第18页
     ·空间回收第18页
   ·MapReduce并行编程模型第18-22页
     ·映射第18-19页
     ·混合第19页
     ·归约第19-20页
     ·MapReduce执行流程第20-22页
4 海量数据搜索模型设计第22-28页
   ·模型总体结构第22-23页
   ·子系统设计第23-25页
     ·分布式爬行子系统的设计第23-24页
     ·分布式索引子系统的设计第24-25页
     ·分布式查询子系统的设计第25页
   ·模型执行流程第25-28页
     ·爬行流程第25-26页
     ·索引流程第26-27页
     ·查询流程第27-28页
5 海量数据搜索模型实现第28-38页
   ·分布式爬行子系统的实现第28-33页
     ·主要模块第28页
     ·URL选择与分割模块第28页
     ·网页获取模块第28-29页
     ·网页解析模块第29-31页
     ·链接过滤模块第31-32页
     ·数据存储模块第32-33页
   ·分布式索引子系统的实现第33-35页
     ·多格式文档统一处理模块第33页
     ·中文分词模块第33-34页
     ·分布式索引生成模块第34-35页
   ·分布式查询子系统的实现第35-38页
     ·分布式查询器模块第36-38页
6 海量数据搜索模型测试与分析第38-47页
   ·模型部署第38-43页
     ·硬件配置第38页
     ·软件环境第38页
     ·软件部署第38-42页
     ·启动Hadoop第42-43页
   ·系统性能测试与分析第43-47页
     ·文件读写测试第43-44页
     ·检索功能测试第44-45页
     ·系统分析第45-47页
7 结论第47-48页
8 展望第48-49页
9 参考文献第49-54页
10 攻读硕士学位期间发表的论文第54-55页
11 致谢第55页

论文共55页,点击 下载论文
上一篇:嵌入式Linux下USB大容量存储设备驱动程序的研究和应用
下一篇:基于不同尺度下的指标协同作用的外汇交易进场点分析