首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于MapReduce用户聚类算法在Web日志挖掘中应用

摘要第1-6页
ABSTRACT第6-9页
第一章 绪论第9-13页
   ·研究背景和意义第9-10页
   ·国内外研究现状第10页
   ·研究目标第10-11页
   ·研究的内容和组织结构第11-12页
   ·本章小结第12-13页
第二章 相关理论及技术概述第13-28页
   ·Nginx日志格式第13页
   ·MapReduce框架分析第13-16页
     ·作业的提交第14-15页
     ·作业的初始化第15页
     ·任务的分配第15-16页
     ·任务的执行第16页
   ·Hive第16-22页
     ·和传统数据库进行比较第17-18页
     ·Hive体系结构的内部分析第18-22页
   ·Protobuffer优势第22-23页
   ·日志挖掘相关算法第23-27页
     ·相似度计算方法第24页
     ·K-means聚类算法第24-25页
     ·协同过滤推荐算法第25-27页
   ·本章小结第27-28页
第三章 用户聚类第28-47页
   ·用户聚类流程第28-29页
   ·数据预处理第29-37页
     ·数据清理第29-31页
     ·用户识别第31-34页
     ·会话识别第34-37页
   ·相关矩阵的构建第37-41页
     ·构建访问次数维度矩阵第37-38页
     ·构建访问路径维度矩阵第38-39页
     ·构建语义维度矩阵第39-41页
   ·用户相似度计算第41-45页
     ·相似度矩阵的构建过程第41-44页
     ·相似度计算第44-45页
   ·聚类算法第45-46页
   ·本章小结第46-47页
第四章 实验结果第47-54页
   ·系统设计第47-48页
   ·实验环境第48-49页
   ·实验结果与分析第49-53页
   ·本章小结第53-54页
第五章 结论第54-56页
   ·论文总结第54-55页
   ·论文展望第55-56页
参考文献第56-58页
攻读学位期间所取得的相关科研成果第58-59页
致谢第59-60页

论文共60页,点击 下载论文
上一篇:回归方法估算最长频繁模式长度研究
下一篇:基于DSP的电子行走辅助系统的设计与实现