云计算平台下的数据挖掘研究

摘要	第1-5页
Abstract	第5-8页
第一章绪论	第8-12页
·课题背景	第8-10页
·数据挖掘	第8页
·互联网背景下的大规模数据挖掘	第8-9页
·云计算平台	第9-10页
·研究目的和意义	第10-11页
·论文研究内容	第11页
·论文组织结构	第11-12页
第二章云计算平台相关技术介绍	第12-21页
·分布式数据存储系统 BigTable	第12-13页
·BigTable 概述	第12页
·BigTable 数据模型	第12-13页
·Google 分布式文件系统 GFS	第13-16页
·GFS 简介	第13-14页
·GFS 系统架构	第14-15页
·GFS 研究总结	第15-16页
·MapReduce 编程框架	第16-18页
·编程模式	第16页
·MapReduce 计算过程	第16-17页
·研究 MapReduce 的意义	第17-18页
·Hadoop 云计算平台	第18-20页
·Hadoop 概述	第18页
·Hadoop 构造模块	第18-20页
·本章小结	第20-21页
第三章基于 MapReduce 的逻辑回归研究	第21-31页
·逻辑回归简介	第21-22页
·基于模拟退火的随机梯度下降算法	第22-25页
·梯度下降算法介绍	第22-23页
·模拟退火介绍	第23页
·模拟退火算法描述	第23-24页
·算法改进	第24-25页
·特征变量选择	第25-26页
·显著性检验	第25页
·常见特征变量选择方法	第25-26页
·单一特征变量选择算法	第26页
·算法 MapReduce 化	第26-30页
·训练样本预处理	第27-28页
·模型训练	第28-30页
·本章小结	第30-31页
第四章基于 MapReduce 的关联规则挖掘研究	第31-46页
·关联规则挖掘简介	第31-32页
·关联规则挖掘详解	第32-34页
·频繁项集	第32-33页
·关联规则	第33-34页
·常见关联规则算法	第34-36页
·基于频繁项集划分的并行化关联算法	第36-39页
·频繁项集划分算法分析	第36-37页
·随机子集抽样	第37-38页
·算法 MapReduce 化	第38-39页
·基于 HBase 的 Eclat 并行化关联规则算法	第39-45页
·Eclat 算法简介	第39-40页
·Eclat 支持度计算方法	第40-41页
·Eclat 算法分析	第41页
·Eclat 算法改进	第41-42页
·使用 HBase 优化处理 Eclat 算法	第42-43页
·进一步使用 MapReduce 改进算法	第43-45页
·本章小结	第45-46页
第五章实验与分析	第46-55页
·实验环境	第46-50页
·主机规划	第46页
·Hadoop 配置与安装	第46-48页
·HBase 配置与安装	第48-50页
·实验一：挖掘潜在消费者的逻辑回归	第50-52页
·数据准备	第50页
·实验结果与分析	第50-52页
·实验二：用户广告推荐的关联规则挖掘	第52-54页
·数据准备	第52页
·实验结果与分析	第52-54页
·本章小结	第54-55页
第六章总结与展望	第55-56页
·论文总结	第55页
·未来展望	第55-56页
参考文献	第56-58页
附录1 攻读硕士学位期间撰写的论文	第58-59页
致谢	第59页