基于Hadoop的数据挖掘算法的分析与研究

摘要	第1-4页
Abstract	第4-10页
第一章绪论	第10-14页
·课题背景及意义	第10-11页
·国内外研究现状	第11-12页
·论文研究内容	第12页
·论文组织结构	第12-14页
第二章 Hadoop技术框架研究	第14-28页
·Hadoop概况	第14-15页
·Hadoop历史	第14页
·Hadoop优势	第14页
·Hadoop子项目	第14-15页
·MapReduce编程模型	第15-20页
·MapReduce逻辑模型	第15-16页
·MapReduce任务流程	第16-19页
·MapReduce容错机制	第19-20页
·HDFS机制	第20-24页
·HDFS特点及局限性	第20-21页
·HDFS相关概念	第21-22页
·HDFS体系结构	第22-24页
·Mahout算法库	第24-26页
·Mahout概况	第24-25页
·Mahout算法	第25-26页
·本章小结	第26-28页
第三章 K-Means算法并行策略研究	第28-52页
·什么是聚类分析	第28-29页
·K-Means算法描述	第29-33页
·K-Means算法并行策略	第33-50页
·Mahout数据模型	第33-40页
·向量表示	第33页
·相似度计算	第33-35页
·将数据转化为向量	第35-37页
·将文本转化为向量	第37-40页
·K-Means算法并行分析	第40-50页
·并行策略	第40-41页
·Mahout K-Means结构	第41-42页
·K-Means聚类MapReduce实现	第42-50页
·本章小结	第50-52页
第四章实验与评估	第52-68页
·实验平台搭建	第52-55页
·硬件环境	第52页
·软件环境	第52页
·搭建Hadoop集群	第52-55页
·安装JDK	第52-53页
·配置SSH无密码登录	第53页
·安装Hadoop	第53-55页
·安装Mahout	第55页
·实验过程	第55-65页
·实验一	第55-64页
·数据预处理	第56-59页
·K-Means过程	第59-60页
·实验结果	第60-63页
·实验评估	第63-64页
·实验二	第64-65页
·环境配置	第64页
·数据准备	第64页
·K-Means过程	第64-65页
·实验结果	第65页
·本章小结	第65-68页
第五章总结与展望	第68-70页
·论文总结	第68页
·未来展望	第68-70页
致谢	第70-72页
参考文献	第72-76页
附录A：攻读学位期间发表论文目录	第76页