基于MapReduce用户聚类算法在Web日志挖掘中应用

摘要	第1-6页
ABSTRACT	第6-9页
第一章绪论	第9-13页
·研究背景和意义	第9-10页
·国内外研究现状	第10页
·研究目标	第10-11页
·研究的内容和组织结构	第11-12页
·本章小结	第12-13页
第二章相关理论及技术概述	第13-28页
·Nginx日志格式	第13页
·MapReduce框架分析	第13-16页
·作业的提交	第14-15页
·作业的初始化	第15页
·任务的分配	第15-16页
·任务的执行	第16页
·Hive	第16-22页
·和传统数据库进行比较	第17-18页
·Hive体系结构的内部分析	第18-22页
·Protobuffer优势	第22-23页
·日志挖掘相关算法	第23-27页
·相似度计算方法	第24页
·K-means聚类算法	第24-25页
·协同过滤推荐算法	第25-27页
·本章小结	第27-28页
第三章用户聚类	第28-47页
·用户聚类流程	第28-29页
·数据预处理	第29-37页
·数据清理	第29-31页
·用户识别	第31-34页
·会话识别	第34-37页
·相关矩阵的构建	第37-41页
·构建访问次数维度矩阵	第37-38页
·构建访问路径维度矩阵	第38-39页
·构建语义维度矩阵	第39-41页
·用户相似度计算	第41-45页
·相似度矩阵的构建过程	第41-44页
·相似度计算	第44-45页
·聚类算法	第45-46页
·本章小结	第46-47页
第四章实验结果	第47-54页
·系统设计	第47-48页
·实验环境	第48-49页
·实验结果与分析	第49-53页
·本章小结	第53-54页
第五章结论	第54-56页
·论文总结	第54-55页
·论文展望	第55-56页
参考文献	第56-58页
攻读学位期间所取得的相关科研成果	第58-59页
致谢	第59-60页