摘要 | 第4-6页 |
ABSTRACT | 第6-7页 |
目录 | 第8-10页 |
第一章 绪论 | 第10-14页 |
1.1 研究背景与意义 | 第10-11页 |
1.2 国内外研究现状 | 第11-12页 |
1.3 本文的研究内容 | 第12-13页 |
1.4 本文的组织结构 | 第13页 |
1.5 本章小结 | 第13-14页 |
第二章 相关理论与技术 | 第14-28页 |
2.1 Web 日志挖掘基本理论 | 第14-18页 |
2.1.1 Web 日志挖掘的定义 | 第14-15页 |
2.1.2 Web 日志挖掘的过程 | 第15-17页 |
2.1.3 Web 日志挖掘的分析方法 | 第17-18页 |
2.2 Hadoop 平台与 MapReduce 框架 | 第18-27页 |
2.2.1 Hadoop 平台概述 | 第18-21页 |
2.2.2 Hadoop 分布式文件系统 HDFS | 第21-23页 |
2.2.3 MapReduce 计算框架 | 第23-27页 |
2.3 本章小结 | 第27-28页 |
第三章 基于 Hadoop 平台的网络用户特征属性提取 | 第28-40页 |
3.1 Web 日志预处理 | 第28-31页 |
3.1.1 数据清理 | 第28-30页 |
3.1.2 用户识别 | 第30-31页 |
3.2 用户特征属性 | 第31-35页 |
3.2.1 用户访问商品类别属性 | 第32-33页 |
3.2.2 访问频率 | 第33页 |
3.2.3 停留时间 | 第33-34页 |
3.2.4 用户地理位置 | 第34页 |
3.2.5 用户历史访问商品类别属性 | 第34-35页 |
3.3 基于 MapReduce 的用户特征属性提取设计 | 第35-39页 |
3.4 本章小结 | 第39-40页 |
第四章 网络用户行为分类并行化设计 | 第40-49页 |
4.1 常用分类方法 | 第40-42页 |
4.1.1 决策树法 | 第40-41页 |
4.1.2 支持向量机 | 第41页 |
4.1.3 K 最近邻法 | 第41页 |
4.1.4 贝叶斯分类 | 第41-42页 |
4.2 基于特征加权的网络用户行为分类器 | 第42-46页 |
4.2.1 朴素贝叶斯分类 | 第42-43页 |
4.2.2 基于用户行为特征加权的朴素贝叶斯分类器设计 | 第43-46页 |
4.2.3 网络用户行为分类 | 第46页 |
4.3 基于 MapReduce 的网络用户行为分类器设计 | 第46-48页 |
4.4 本章小结 | 第48-49页 |
第五章 网络用户行为分析系统设计与实现 | 第49-60页 |
5.1 系统设计框架 | 第49-50页 |
5.2 Hadoop 平台搭建 | 第50页 |
5.3 基于 MapReduce 的特征属性提取 | 第50-54页 |
5.4 基于 MapReduce 的特征加权朴素贝叶斯分类器实现 | 第54-58页 |
5.4.1 分类器训练 | 第54-56页 |
5.4.2 分类器测试 | 第56-58页 |
5.5 实验结果分析 | 第58-59页 |
5.6 本章小结 | 第59-60页 |
第六章 总结与展望 | 第60-62页 |
6.1 总结 | 第60-61页 |
6.2 展望 | 第61-62页 |
参考文献 | 第62-65页 |
攻读学位期间的研究成果目录 | 第65-66页 |
致谢 | 第66页 |