首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于Hadoop的大型网站海量数据的统计与应用

摘要第1-6页
Abstract第6-7页
目录第7-9页
图目录第9-10页
表目录第10-11页
第一章 绪论第11-15页
   ·选题的背景与意义第11-12页
   ·国内外研究现状及分析第12-13页
   ·项目简介第13页
   ·本文的主要内容第13-14页
   ·本文的组织第14-15页
第二章 Hadoop相关技术第15-30页
   ·Hadoop简介第15页
   ·HDFS系统第15-20页
     ·Hadoop分布式文件系统第15-16页
     ·体系结构第16-18页
     ·计算与数据存取第18-19页
     ·文件系统的基本操作第19-20页
   ·Map/Reduce编程框架第20-25页
     ·概述第20-21页
     ·原理介绍第21-23页
     ·Shuffle过程第23-25页
   ·Hive第25-29页
     ·Hive简介第25页
     ·Hive与数据库的异同第25-27页
     ·Hive原理第27-28页
     ·Hive的数据存储第28-29页
     ·Hive与Hadoop streaming的比较第29页
   ·本章小结第29-30页
第三章 海量数据处理与统计的需求第30-34页
   ·项目目标第30页
   ·数据的来源第30-31页
   ·多维数据集及统计指标第31-34页
第四章 海量数据处理与统计的设计和实现第34-56页
   ·整体设计第34-35页
   ·用户人群的分类第35-37页
     ·用户人群分类标准第35页
     ·用户人群分类的设计第35-36页
     ·用户人群分类的实现第36-37页
   ·总体数据的统计第37-40页
     ·表的设计与实现第37-40页
     ·HDFS上表的连接操作第40页
   ·广告类型数据统计第40-42页
     ·广告类型概述第40-41页
     ·统计方式与实现第41-42页
     ·结果的分析与应用第42页
   ·cookie重合度统计第42-47页
     ·cookie重合度统计的设计第42-44页
     ·cookie重合度统计的实现第44-47页
     ·结果的分析与应用第47页
   ·品牌探针第47-52页
     ·广告主词与兴趣点概述第47页
     ·品牌探针的设计第47-49页
     ·品牌探针的实现第49-50页
     ·对应分析算法实现第50-52页
   ·全网路统计第52-56页
     ·用户对产品认知过程初探第52-53页
     ·设计与实现第53-55页
     ·结果的应用初步第55-56页
第五章 总结与展望第56-58页
   ·本文小结第56页
   ·进一步展望第56-58页
参考文献第58-61页
致谢第61-63页

论文共63页,点击 下载论文
上一篇:路由系统数据同步模块的设计与实现
下一篇:P2P流媒体服务系统中QoS感知的协同节点优选机制的设计与实现