基于Hadoop的移动互联网网站与服务器流量分析

摘要	第4-5页
ABSTRACT	第5-6页
第一章绪论	第10-13页
1.1 课题背景	第10-11页
1.2 研究意义	第11页
1.3 论文结构	第11-13页
第二章基于云计算的网站与服务器流量数据挖掘系统的设计与实现	第13-23页
2.1 概述	第13-15页
2.1.1 移动互联网网站分析	第13-14页
2.1.2 移动互联网研究现状	第14-15页
2.2 海量数据时代	第15-16页
2.2.1 海量数据的特性	第15-16页
2.2.2 海量数据的挑战	第16页
2.3 Hadoop简介	第16-18页
2.3.1 分布式文件系统	第17页
2.3.2 MapReduce计算模型	第17-18页
2.4 网站与服务器流量数据挖掘系统	第18-21页
2.4.1 系统功能介绍	第18-19页
2.4.2 数据采集过程	第19-20页
2.4.3 系统框架设计	第20-21页
2.5 本章小结	第21-23页
第三章服务器识别和流量分析	第23-33页
3.1 概述	第23-24页
3.2 服务器IP和域名的对应方法	第24-30页
3.2.1 直接提取方法	第24-26页
3.2.2 相似uri方法	第26-27页
3.2.3 Refer方法	第27-28页
3.2.4 临近IP掩码方法	第28-30页
3.3 服务器IP数据分析	第30-32页
3.3.1 服务器流量分析	第30-31页
3.3.2 服务器访问量分析	第31-32页
3.3.3 服务器用户数分析	第32页
3.4 本章小结	第32-33页
第四章网站访问分析	第33-46页
4.1 概述	第33页
4.2 网站资源库	第33-37页
4.2.1 系统组成结构	第33-34页
4.2.2 系统算法原理	第34-37页
4.2.2.1 网站资源目录的创建	第34-36页
4.2.2.2 网站资源树的创建	第36-37页
4.3 网站域名分析	第37-42页
4.3.1 网站综合流量分析	第37-39页
4.3.2 网站综合访问量分析	第39-41页
4.3.3 网站访问用户数分析	第41-42页
4.4 网站域名后缀分析	第42-45页
4.4.1 网站域名后缀数量分布	第43页
4.4.2 网站域名后缀流量分布	第43-44页
4.4.3 网站域名后缀访问量分布	第44-45页
4.5 本章小结	第45-46页
第五章 SP流量特征分析	第46-67页
5.1 概述	第46-47页
5.1.1 SP的定义	第46页
5.1.2 SP的提取方法	第46-47页
5.2 SP的流量特征分析	第47-60页
5.2.1 总流量的时间分布	第47页
5.2.2 访问量的时间分布	第47-48页
5.2.3 访问用户的时间分布	第48-49页
5.2.4 SP的综合流量	第49-52页
5.2.5 SP的综合访问量	第52-54页
5.2.6 SP的访问用户数	第54-56页
5.2.7 SP的综合访问时间	第56-58页
5.2.8 SP的平均访问流量	第58页
5.2.9 SP的平均用户流量	第58-59页
5.2.10 SP的相关性分析	第59-60页
5.3 SP的聚类分析	第60-66页
5.3.1 SP流量的昼夜分布	第60-62页
5.3.2 SP聚类的方法	第62-64页
5.3.3 SP聚类的结果	第64-66页
5.4 本章小结	第66-67页
第六章总结与展望	第67-68页
参考文献	第68-70页
致谢	第70-71页
攻读学位期间发表的学术论文目录	第71页