| 摘要 | 第1-5页 |
| ABSTRACT | 第5-9页 |
| 第1章 绪论 | 第9-15页 |
| ·引言 | 第9-11页 |
| ·Web 挖掘及其研究意义 | 第9-10页 |
| ·论文研究目的与意义 | 第10-11页 |
| ·国内外研究现状 | 第11-13页 |
| ·对web 日志挖掘的研究 | 第11-12页 |
| ·对分布式并行挖掘系统的研究 | 第12-13页 |
| ·基于云计算的应用研究 | 第13页 |
| ·研究内容与论文框架 | 第13-15页 |
| 第2章 云计算技术及web 日志挖掘概述 | 第15-27页 |
| ·云计算介绍 | 第15-20页 |
| ·云计算定义及特点 | 第15-16页 |
| ·云计算的关键技术 | 第16-17页 |
| ·云计算技术的研究现状 | 第17-18页 |
| ·云计算当前研究热点及应用领域 | 第18-20页 |
| ·开源云计算系统 Hadoop 介绍 | 第20-23页 |
| ·Hadoop 平台概述 | 第20页 |
| ·MapReduce 编程模型 | 第20-22页 |
| ·分布式文件存储系统HDFS | 第22-23页 |
| ·web 日志挖掘概述 | 第23-27页 |
| ·Web 日志挖掘的过程 | 第23-25页 |
| ·Web 日志挖掘的主要方法 | 第25-27页 |
| 第3章 基于云计算的web 日志挖掘系统设计 | 第27-41页 |
| ·当前 web 日志挖掘系统分析 | 第27-29页 |
| ·基于单一节点的集中式web 日志挖掘系统 | 第27-28页 |
| ·并行数据挖掘系统 | 第28页 |
| ·基于云计算的web 日志挖掘系统 | 第28-29页 |
| ·云计算平台总体架构设计 | 第29-31页 |
| ·可视化交互平台设计 | 第31-35页 |
| ·算法管理模块 | 第32-34页 |
| ·日志文件管理模块 | 第34页 |
| ·日志挖掘模块 | 第34-35页 |
| ·结果展示模块 | 第35页 |
| ·功能层设计 | 第35-41页 |
| ·预处理管道 | 第36-37页 |
| ·分布式存储 | 第37-39页 |
| ·分布式业务处理 | 第39-41页 |
| 第4章 基于云计算的web 日志挖掘算法研究 | 第41-51页 |
| ·基于有用偏爱度的用户浏览偏爱路径挖掘算法 | 第42-46页 |
| ·有用偏爱度定义 | 第42-45页 |
| ·基于有用偏爱度的用户浏览偏爱路径挖掘算法 | 第45-46页 |
| ·基于 MapReduce 的用户偏爱路径挖掘算法 | 第46-51页 |
| ·基于MapReduce 的数据预处理 | 第46-48页 |
| ·基于MapReduce 的PBPU 算法 | 第48-51页 |
| 第5章 实验分析 | 第51-67页 |
| ·系统开发环境 | 第51-56页 |
| ·系统开发平台 | 第51-52页 |
| ·Hadoop 环境的搭建 | 第52-56页 |
| ·基于 MapReduce 的 PBPU 算法在 Hadoop 上的实现 | 第56-61页 |
| ·实验结果分析 | 第61-67页 |
| ·PBPU 算法准确性分析 | 第61-63页 |
| ·基于MapReduce 的PBPU 算法执行效率分析 | 第63-67页 |
| 第6章 总结与展望 | 第67-69页 |
| ·本文工作总结 | 第67页 |
| ·展望 | 第67-69页 |
| 参考文献 | 第69-71页 |
| 致谢 | 第71-72页 |
| 在读期间发表的学术论文与取得的其他研究成果 | 第72页 |