摘要 | 第1-5页 |
ABSTRACT | 第5-9页 |
第1章 绪论 | 第9-15页 |
·引言 | 第9-11页 |
·Web 挖掘及其研究意义 | 第9-10页 |
·论文研究目的与意义 | 第10-11页 |
·国内外研究现状 | 第11-13页 |
·对web 日志挖掘的研究 | 第11-12页 |
·对分布式并行挖掘系统的研究 | 第12-13页 |
·基于云计算的应用研究 | 第13页 |
·研究内容与论文框架 | 第13-15页 |
第2章 云计算技术及web 日志挖掘概述 | 第15-27页 |
·云计算介绍 | 第15-20页 |
·云计算定义及特点 | 第15-16页 |
·云计算的关键技术 | 第16-17页 |
·云计算技术的研究现状 | 第17-18页 |
·云计算当前研究热点及应用领域 | 第18-20页 |
·开源云计算系统 Hadoop 介绍 | 第20-23页 |
·Hadoop 平台概述 | 第20页 |
·MapReduce 编程模型 | 第20-22页 |
·分布式文件存储系统HDFS | 第22-23页 |
·web 日志挖掘概述 | 第23-27页 |
·Web 日志挖掘的过程 | 第23-25页 |
·Web 日志挖掘的主要方法 | 第25-27页 |
第3章 基于云计算的web 日志挖掘系统设计 | 第27-41页 |
·当前 web 日志挖掘系统分析 | 第27-29页 |
·基于单一节点的集中式web 日志挖掘系统 | 第27-28页 |
·并行数据挖掘系统 | 第28页 |
·基于云计算的web 日志挖掘系统 | 第28-29页 |
·云计算平台总体架构设计 | 第29-31页 |
·可视化交互平台设计 | 第31-35页 |
·算法管理模块 | 第32-34页 |
·日志文件管理模块 | 第34页 |
·日志挖掘模块 | 第34-35页 |
·结果展示模块 | 第35页 |
·功能层设计 | 第35-41页 |
·预处理管道 | 第36-37页 |
·分布式存储 | 第37-39页 |
·分布式业务处理 | 第39-41页 |
第4章 基于云计算的web 日志挖掘算法研究 | 第41-51页 |
·基于有用偏爱度的用户浏览偏爱路径挖掘算法 | 第42-46页 |
·有用偏爱度定义 | 第42-45页 |
·基于有用偏爱度的用户浏览偏爱路径挖掘算法 | 第45-46页 |
·基于 MapReduce 的用户偏爱路径挖掘算法 | 第46-51页 |
·基于MapReduce 的数据预处理 | 第46-48页 |
·基于MapReduce 的PBPU 算法 | 第48-51页 |
第5章 实验分析 | 第51-67页 |
·系统开发环境 | 第51-56页 |
·系统开发平台 | 第51-52页 |
·Hadoop 环境的搭建 | 第52-56页 |
·基于 MapReduce 的 PBPU 算法在 Hadoop 上的实现 | 第56-61页 |
·实验结果分析 | 第61-67页 |
·PBPU 算法准确性分析 | 第61-63页 |
·基于MapReduce 的PBPU 算法执行效率分析 | 第63-67页 |
第6章 总结与展望 | 第67-69页 |
·本文工作总结 | 第67页 |
·展望 | 第67-69页 |
参考文献 | 第69-71页 |
致谢 | 第71-72页 |
在读期间发表的学术论文与取得的其他研究成果 | 第72页 |