基于Hadoop的大型网站海量数据的统计与应用

摘要	第1-6页
Abstract	第6-7页
目录	第7-9页
图目录	第9-10页
表目录	第10-11页
第一章绪论	第11-15页
·选题的背景与意义	第11-12页
·国内外研究现状及分析	第12-13页
·项目简介	第13页
·本文的主要内容	第13-14页
·本文的组织	第14-15页
第二章 Hadoop相关技术	第15-30页
·Hadoop简介	第15页
·HDFS系统	第15-20页
·Hadoop分布式文件系统	第15-16页
·体系结构	第16-18页
·计算与数据存取	第18-19页
·文件系统的基本操作	第19-20页
·Map/Reduce编程框架	第20-25页
·概述	第20-21页
·原理介绍	第21-23页
·Shuffle过程	第23-25页
·Hive	第25-29页
·Hive简介	第25页
·Hive与数据库的异同	第25-27页
·Hive原理	第27-28页
·Hive的数据存储	第28-29页
·Hive与Hadoop streaming的比较	第29页
·本章小结	第29-30页
第三章海量数据处理与统计的需求	第30-34页
·项目目标	第30页
·数据的来源	第30-31页
·多维数据集及统计指标	第31-34页
第四章海量数据处理与统计的设计和实现	第34-56页
·整体设计	第34-35页
·用户人群的分类	第35-37页
·用户人群分类标准	第35页
·用户人群分类的设计	第35-36页
·用户人群分类的实现	第36-37页
·总体数据的统计	第37-40页
·表的设计与实现	第37-40页
·HDFS上表的连接操作	第40页
·广告类型数据统计	第40-42页
·广告类型概述	第40-41页
·统计方式与实现	第41-42页
·结果的分析与应用	第42页
·cookie重合度统计	第42-47页
·cookie重合度统计的设计	第42-44页
·cookie重合度统计的实现	第44-47页
·结果的分析与应用	第47页
·品牌探针	第47-52页
·广告主词与兴趣点概述	第47页
·品牌探针的设计	第47-49页
·品牌探针的实现	第49-50页
·对应分析算法实现	第50-52页
·全网路统计	第52-56页
·用户对产品认知过程初探	第52-53页
·设计与实现	第53-55页
·结果的应用初步	第55-56页
第五章总结与展望	第56-58页
·本文小结	第56页
·进一步展望	第56-58页
参考文献	第58-61页
致谢	第61-63页