摘要 | 第4-5页 |
ABSTRACT | 第5页 |
第1章 绪论 | 第8-13页 |
1.1 课题背景及研究的目的和意义 | 第8-9页 |
1.2 与本课题有关的国内外研究状况 | 第9-11页 |
1.3 本文的主要研究内容 | 第11-12页 |
1.4 论文组织结构 | 第12-13页 |
第2章 相关理论与技术概述 | 第13-22页 |
2.1 NGINX日志格式 | 第13-14页 |
2.2 WEB数据挖掘技术 | 第14-17页 |
2.2.1 数据挖掘基础概述 | 第14页 |
2.2.2 数据预处理 | 第14-17页 |
2.3 HADOOP核心技术 | 第17-20页 |
2.3.1 分布式计算框架原理 | 第18-19页 |
2.3.2 分布式计算框架运行机制 | 第19-20页 |
2.4 本章小结 | 第20-22页 |
第3章 基于用户行为的数据挖掘系统需求分析 | 第22-35页 |
3.1 基于用户行为的数据挖掘系统业务分析 | 第22页 |
3.2 基于用户行为的数据挖掘系统功能需求分析 | 第22-33页 |
3.2.1 任务管理模块功能需求分析 | 第23-28页 |
3.2.2 数据分析模块功能需求分析 | 第28-30页 |
3.2.3 数据展现模块与公共模块功能需求分析 | 第30-33页 |
3.3 基于用户行为的数据挖掘系统性能分析 | 第33-34页 |
3.4 本章小结 | 第34-35页 |
第4章 基于用户行为的数据挖掘系统设计与实现 | 第35-76页 |
4.1 基于用户行为的数据挖掘系统的总体设计 | 第35-42页 |
4.1.1 系统的功能结构设计 | 第35-37页 |
4.1.2 系统的总体架构设计 | 第37-38页 |
4.1.3 数据库设计 | 第38-42页 |
4.2 作业管理子系统的设计与实现 | 第42-57页 |
4.2.1 调度配置管理子模块的详细设计与实现 | 第42-51页 |
4.2.2 数据同步管理子模块的详细设计与实现 | 第51-53页 |
4.2.3 历史调度管理子模块的详细设计与实现 | 第53-55页 |
4.2.4 调度日志管理子模块的详细设计与实现 | 第55-57页 |
4.3 数据分析子系统的设计与实现 | 第57-68页 |
4.3.1 日志解析子模块的详细设计与实现 | 第57-60页 |
4.3.2 用户聚类子模块的详细设计与实现 | 第60-64页 |
4.3.3 用户行为路径分析子模块的详细设计与实现 | 第64-68页 |
4.4 数据展现子系统的设计与实现 | 第68-75页 |
4.4.1 报表自动化与自助建表子模块的详细设计与实现 | 第68-72页 |
4.4.2 系统常用功能子模块的详细设计与实现 | 第72-75页 |
4.5 本章小结 | 第75-76页 |
第5章 基于用户行为分析系统测试 | 第76-83页 |
5.1 系统测试分析 | 第76-77页 |
5.1.1 测试目的 | 第76页 |
5.1.2 测试方法 | 第76-77页 |
5.2 测试环境 | 第77页 |
5.3 功能测试 | 第77-80页 |
5.3.1 作业管理模块功能测试 | 第77-78页 |
5.3.2 数据分析管理模块功能测试 | 第78-79页 |
5.3.3 数据展现管理模块功能测试 | 第79-80页 |
5.4 性能测试 | 第80-81页 |
5.5 本章小结 | 第81-83页 |
结论 | 第83-84页 |
参考文献 | 第84-88页 |
致谢 | 第88-89页 |
个人简历 | 第89页 |