百度玩图的用户访问行为分析系统设计
摘要 | 第4-5页 |
Abstract | 第5页 |
第1章 绪论 | 第8-12页 |
1.1 研究背景 | 第8-9页 |
1.2 国内外研究现状 | 第9-10页 |
1.3 本文的研究内容 | 第10-12页 |
第2章 相关技术 | 第12-18页 |
2.1 日志用户行为分析方法 | 第12-14页 |
2.1.1 日志用户行为的原理 | 第12页 |
2.1.2 日志用户行为分析方法概述 | 第12-13页 |
2.1.3 日志用户行为分析目的 | 第13页 |
2.1.4 日志信息特点 | 第13-14页 |
2.1.5 日志用户行为常用概念 | 第14页 |
2.2 hadoop 简介 | 第14-16页 |
2.2.1 hadoop 运行机制 | 第14-15页 |
2.2.2 基于 hadoop 的日志分析算法 | 第15-16页 |
2.3 脚本简介 | 第16-18页 |
2.3.1 linux 下 shell 简介 | 第16-17页 |
2.3.2 python 简介 | 第17-18页 |
第3章 百度玩图用户行为分析系统的需求分析与设计 | 第18-26页 |
3.1 系统的需求分析 | 第18-20页 |
3.1.1 入口统计 | 第18页 |
3.1.2 检索导流分析 | 第18页 |
3.1.3 各频道需求统计 | 第18-19页 |
3.1.4 留存数据 | 第19页 |
3.1.5 回访数据 | 第19-20页 |
3.2 系统的概要设计 | 第20-21页 |
3.3 系统的详细设计 | 第21-26页 |
3.3.1 日志数据预处理 | 第21-23页 |
3.3.2 日志的 session 切割 | 第23-24页 |
3.3.3 日志用户行为分析 | 第24页 |
3.3.4 基于 hadoop 的日志分布式处理 | 第24-26页 |
第4章 百度玩图用户行为分析系统的实现 | 第26-46页 |
4.1 系统运行环境 | 第26页 |
4.2 日志数据预处理 | 第26-28页 |
4.3 日志的 session 切割 | 第28-31页 |
4.4 基于 hadoop 的日志分布式处理 | 第31页 |
4.5 用户行为特点分析及实验 | 第31-46页 |
4.5.1 入口统计 | 第31-34页 |
4.5.2 检索导流分析 | 第34页 |
4.5.3 各频道需求统计 | 第34-43页 |
4.5.4 留存数据 | 第43-44页 |
4.5.5 回访数据 | 第44-46页 |
第5章 工作总结和展望 | 第46-47页 |
参考文献 | 第47-49页 |
致谢 | 第49页 |