基于大数据技术的电信客户维系挽的分析与研究

摘要	第4-5页
Abstract	第5-6页
1 绪论	第10-15页
1.1 课题研究背景及意义	第10-12页
1.1.1 课题研究背景	第10-11页
1.1.2 课题研究意义	第11-12页
1.2 国内外研究现状	第12-13页
1.3 论文结构安排	第13-15页
2 相关技术理论介绍	第15-28页
2.1 网络爬虫	第15-18页
2.1.1 网络爬虫原理	第15页
2.1.2 网络爬虫的基本结构	第15-17页
2.1.3 网络爬虫搜索策略	第17-18页
2.2 HADOOP平台	第18-21页
2.2.1 分布式文件系统HDFS	第18-20页
2.2.2 Map Reduce分布式计算模型	第20-21页
2.3 并行计算框架Spark	第21-27页
2.3.1 Spark的组织架构	第22-23页
2.3.2 Spark的运行架构及计算模型	第23-24页
2.3.3 Map Reduce与Spark的Shuffle原理	第24-26页
2.3.4 优势对比分析	第26-27页
2.4 本章小结	第27-28页
3 基于国内主流媒体的客户维系挽留研究	第28-38页
3.1 面向新浪微博的客户维系挽留的研究	第28页
3.2 面向新浪微博的网络爬虫框架选择	第28-31页
3.3 面向新浪微博的网络爬虫关键技术	第31-34页
3.4 面向新浪微博的网络爬虫相关设计	第34-35页
3.5 面向新浪微博的网络爬虫实现	第35-37页
3.6 本章小结	第37-38页
4 环境搭建与用户数据处理	第38-43页
4.1 HADOOP环境搭建	第38-40页
4.1.1 HADOOP硬件环境和物理结构	第38-39页
4.1.2 HADOOP集群配置	第39-40页
4.2 Spark环境搭建及部署	第40页
4.3 系统测试与数据处理	第40-42页
4.4 本章小结	第42-43页
5 用户数据分析与对策研究	第43-53页
5.1 Python Matplotlib绘图库	第43-44页
5.2 数据可视化实现	第44-47页
5.3 客户维系挽留可行性对策与建议	第47-52页
5.3.1 套餐资费问题改进对策与建议	第47-48页
5.3.2 宽带网络问题改进对策与建议	第48-49页
5.3.3 手机终端问题改进对策与建议	第49-50页
5.3.4 服务与安全保障改进对策与建议	第50-52页
5.4 本章小结	第52-53页
6 总结与展望	第53-55页
6.1 总结	第53-54页
6.2 展望	第54-55页
参考文献	第55-57页
个人简历	第57-58页
致谢	第58页