摘要 | 第1-5页 |
Abstract | 第5-10页 |
第一章 绪论 | 第10-16页 |
·课题背景与研究意义 | 第10-11页 |
·国内外研究现状 | 第11-14页 |
·Web 日志挖掘国内外现状 | 第11-13页 |
·云计算国内外研究现状 | 第13-14页 |
·本文组织结构 | 第14-16页 |
第二章 Web 日志挖掘基本理论 | 第16-27页 |
·Web 挖掘基本理论 | 第16-17页 |
·Web 挖掘定义 | 第16页 |
·Web 挖掘的分类 | 第16-17页 |
·Web 日志挖掘理论 | 第17-25页 |
·Web 日志挖掘的过程 | 第17-18页 |
·Web 日志采集 | 第18-21页 |
·Web 日志的预处理 | 第21-24页 |
·Web 日志挖掘的主要分析方法 | 第24-25页 |
·Web 日志挖掘的应用 | 第25-26页 |
·本章小结 | 第26-27页 |
第三章 MapReduce 编程模型介绍 | 第27-37页 |
·MapReduce 编程模型 | 第27-28页 |
·Hadoop 开源分布式并行平台介绍 | 第28-36页 |
·概述 | 第28-29页 |
·Hadoop 分布式文件系统:HDFS | 第29-31页 |
·Hadoop 下MapReduce 的执行原理 | 第31-34页 |
·基于Hadoop 的编程方式 | 第34-35页 |
·Hadoop 执行中的性能分析 | 第35-36页 |
·本章小结 | 第36-37页 |
第四章 基于MapReduce 的关联规则挖掘算法的研究 | 第37-50页 |
·关联规则相关概念和定义 | 第37-39页 |
·Apriori 算法介绍 | 第39-44页 |
·Apriori 算法描述 | 第39-42页 |
·Apriori 算法的不足 | 第42页 |
·AprioriTid 算法 | 第42-44页 |
·关联规则挖掘并行算法探讨 | 第44-46页 |
·并行关联规则挖掘算法介绍 | 第44-45页 |
·传统并行关联规则挖掘算法的不足 | 第45-46页 |
·基于划分的AprioriTid 算法 | 第46-49页 |
·算法的提出 | 第46页 |
·算法思想 | 第46-47页 |
·算法证明 | 第47-48页 |
·算法实现 | 第48-49页 |
·本章小结 | 第49-50页 |
第五章 基于Hadoop 的Web 日志挖掘系统的实现 | 第50-63页 |
·开发环境 | 第50-52页 |
·日志数据的收集 | 第52-54页 |
·系统整体设计 | 第54-55页 |
·Web 日志的预处理 | 第55-59页 |
·频繁集的挖掘 | 第59-62页 |
·本章小结 | 第62-63页 |
第六章 实验与分析 | 第63-69页 |
·实验平台 | 第63页 |
·实验步骤 | 第63-65页 |
·方案设计 | 第63-64页 |
·实验前的准备 | 第64页 |
·实验过程 | 第64-65页 |
·执行结果与结论 | 第65-68页 |
·本章小结 | 第68-69页 |
第七章 总结与展望 | 第69-70页 |
·总结 | 第69页 |
·对未来的展望 | 第69-70页 |
致谢 | 第70-71页 |
参考文献 | 第71-74页 |