首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于MapReduce的海量点击流信息挖掘研究

摘要第1-6页
ABSTRACT第6-10页
第一章 绪论第10-18页
   ·Web 点击流信息挖掘概述第10-13页
     ·Web 点击流挖掘第10-12页
     ·Web 日志抽取与描述第12-13页
   ·互联网海量数据挖掘概述第13-14页
   ·国内外研究现状及分析第14-16页
     ·点击流序列模式挖掘方法第14-15页
     ·推荐算法第15-16页
   ·论文主要工作第16页
   ·论文内容安排第16-18页
第二章 关键技术综述第18-25页
   ·MapReduce 的文件系统支持第18-20页
     ·分布式文件系统第18-19页
     ·Google 分布式文件系统 GFS第19-20页
   ·MapReduce 关键技术第20-21页
     ·MapReduce 计算模式原理第20-21页
     ·MapReduce 编程方式第21页
   ·MapReduce 模式实现的数据集操作第21-25页
     ·基于 MapReduce 的选择运算第21页
     ·基于 MapReduce 的投影运算第21页
     ·基于 MapReduce 的并、交和差运算第21-22页
     ·基于 MapReduce 的自然连接与一般性连接运算第22-23页
     ·基于 MapReduce 的分组和聚合运算第23页
     ·矩阵乘法第23-25页
第三章 基于 HDFS 存储方式的数据仓库与开源分布式数据挖掘架构第25-32页
   ·基于 HDFS 的数据仓库支撑体系第25-27页
   ·Web 日志数据的 ETL 过程第27-31页
     ·源数据同步到 HDFS第27-28页
     ·使用 Hive 数据仓库管理第28-29页
     ·日志数据 ETL 过程第29-31页
   ·分布式数据挖掘策略第31-32页
第四章 基于 MapReduce 的点击流频繁序列模式挖掘第32-40页
   ·关联规则挖掘与频繁模式第32-33页
   ·问题描述与定义第33页
   ·点击流数据预处理第33-34页
   ·使用 MapReduce 改进 BIDE 点击流序列模式挖掘算法第34-37页
     ·BIDE 算法思想第34-36页
     ·BIDE 算法描述第36页
     ·基于 MapReduce 的 BIDE 点击流序列模式挖掘算法第36-37页
   ·算法测试与分析第37-40页
第五章 基于点击流的推荐算法应用第40-48页
   ·基于项的协同过滤推荐第40-41页
   ·维度与模式融合第41-42页
   ·基于点击流的推荐算法第42-45页
     ·基于项的推荐算法第42-43页
     ·模式融合机器学习算法第43-44页
     ·MapReduce 实现点击流的项推荐算法第44-45页
   ·实验与分析第45-48页
第六章 总结与展望第48-49页
   ·本文研究工作总结第48页
   ·未来工作及展望第48-49页
致谢第49-50页
参考文献第50-53页
附录第53-54页
详细摘要第54-56页

论文共56页,点击 下载论文
上一篇:基于网络位置的Web服务推荐技术研究
下一篇:面向低带宽网络的数据容灾恢复系统及其优化技术