Hadoop电信大数据的用户分群算法研究与实现

摘要	第6-7页
abstract	第7-8页
第1章绪论	第12-20页
1.1 课题研究背景及意义	第12-14页
1.2 国内外研究现状	第14-18页
1.3 本文研究内容	第18页
1.4 论文结构安排	第18-20页
第2章基础理论及相关技术	第20-33页
2.1 Hadoop生态系统	第20-23页
2.1.1 Hadoop系统架构	第20-21页
2.1.2 Hadoop系统基本组成	第21-23页
2.2 HDFS分布式文件系统	第23-27页
2.2.1 HDFS体系结构	第23-24页
2.2.2 HDFS工作流程	第24-26页
2.2.3 HDFS可靠性措施	第26-27页
2.3 MapReduce并行编程框架	第27-30页
2.3.1 MapReduce基本编程模型	第28页
2.3.2 MapReduce程序作业流程	第28-30页
2.4 数据挖掘	第30-32页
2.4.1 数据挖掘技术	第30页
2.4.2 数据挖掘基本算法	第30-31页
2.4.3 Hadoop的数据挖掘机理	第31-32页
2.5 本章小结	第32-33页
第3章聚类算法研究	第33-48页
3.1 聚类分析	第33-39页
3.1.1 聚类算法	第34-35页
3.1.2 K-means算法	第35-38页
3.1.3 MeanShift算法	第38-39页
3.2 K-means的MapReduce并行化	第39-41页
3.2.1 K-means的MapReduce设计方案	第39-40页
3.2.2 K-means的MapReduce实现	第40-41页
3.3 K-means算法的改进	第41-43页
3.3.1 k-means算法缺点	第41-42页
3.3.2 改进K-means算法的设计	第42-43页
3.4 基于MapReduce改进聚类算法的设计	第43-47页
3.4.1 MeanShift的并行化	第43-46页
3.4.2 K-means的并行化	第46-47页
3.4.3 改进K-means算法时间复杂度	第47页
3.5 本章小结	第47-48页
第4章基于改进K-means算法的电信用户分群	第48-57页
4.1 用户分群需求分析	第48-49页
4.2 用户数据预处理	第49-50页
4.2.1 数据选取	第49页
4.2.2 数据清洗	第49-50页
4.2.3 数据转换	第50页
4.3 用户分群	第50-55页
4.3.1 用户分群方法	第51-52页
4.3.2 RFM模型分析	第52-53页
4.3.3 RFM模型的改进	第53-55页
4.4 改进K-means算法MapReduce实现	第55-56页
4.4.1 MeanShift追踪K值	第55-56页
4.4.2 K-means并行化阶段	第56页
4.5 本章小结	第56-57页
第5章实验结果及分析	第57-72页
5.1 实验环境	第57-63页
5.1.1 Hadoop集群	第57-58页
5.1.2 Hadoop完全分布式集群搭建	第58-63页
5.2 实验数据	第63-66页
5.3 电信用户分群实验	第66-71页
5.3.1 实验内容	第66-67页
5.3.2 实验结果分析	第67-71页
5.4 本章小结	第71-72页
结论	第72-74页
1 全文总结	第72-73页
2 工作展望	第73-74页
参考文献	第74-78页
攻读硕士学位期间发表的论文和获得的科研成果	第78-79页
致谢	第79-80页