基于抽样的云频繁项集挖掘算法研究

摘要	第1-6页
Abstract	第6-8页
致谢	第8-13页
第一章绪论	第13-18页
·研究背景和现状	第13-15页
·研究内容及意义	第15-16页
·论文组织结构	第16-18页
第二章 Hadoop平台分析	第18-35页
·Hadoop框架结构	第18-19页
·Hadoop分布式文件系统	第19-24页
·HDFS基本结构	第19-20页
·HDFS的数据可靠性	第20-21页
·HDFS数据读写	第21-23页
·HDFS常用命令	第23-24页
·Mapreduce并行编程框架	第24-31页
·Mapreduce功能特点	第24-25页
·Mapreduce执行流程	第25-28页
·Mapreduce高阶运用	第28-29页
·Mapreduce的调度	第29-31页
·Hadoop集群配置	第31-34页
·安装SSH	第31-32页
·Hadoop配置	第32-33页
·Hadoop监控Web界面	第33-34页
·小结	第34-35页
第三章基于Hadoop的并行抽样算法设计	第35-47页
·抽样算法	第35-37页
·简单随机抽样	第35页
·系统抽样	第35-36页
·整群抽样	第36页
·分层抽样	第36-37页
·并行抽样算法提出原因	第37-38页
·算法设计思想和数学证明	第38-39页
·算法的Hadoop平台实现	第39-42页
·Mapreduce的输入分割	第39-40页
·Mapreduce输入分片实现类	第40页
·并行抽样的mapreduce实现	第40-42页
·算法实验验证	第42-46页
·实验数据和实验环境	第42-43页
·实验执行	第43-44页
·实验结果分析	第44-46页
·与普通随机抽样比较	第46页
·小结	第46-47页
第四章基于抽样的频繁项集并行发现算法设计	第47-65页
·关联算法和频繁项集	第47-49页
·基础定义	第47页
·频繁项集的应用	第47-48页
·项集的单调性	第48-49页
·传统频繁项集发现算法及其局限	第49-52页
·传统A-priori算法分析	第49-50页
·传统A-priori局限性	第50页
·传统A-priori改进	第50-52页
·海量数据云频繁项集算法思想	第52-55页
·算法提出原因	第52-53页
·算法具体思想	第53-55页
·算法并行实现	第55-57页
·算法实验验证	第57-63页
·实验数据和实验环境	第57-60页
·实验执行	第60-62页
·实验结果分析	第62-63页
·小结	第63-65页
第五章总结和展望	第65-67页
·本文工作总结	第65-66页
·本文创新点	第66页
·今后研究工作	第66-67页
参考文献	第67-71页
读研期间发表的学术论文及参加的科研项目	第71-72页