中文摘要 | 第3-4页 |
英文摘要 | 第4页 |
1 绪论 | 第7-14页 |
1.1 大数据的产生背景及研究意义 | 第7-9页 |
1.2 大数据的基本概念 | 第9-10页 |
1.3 国内外发展现状 | 第10-13页 |
1.4 本文主要内容和结构安排 | 第13-14页 |
2 相关理论简介 | 第14-22页 |
2.1 引言 | 第14页 |
2.2 数据预处理 | 第14-18页 |
2.2.1 数据清洗 | 第14-15页 |
2.2.2 数据变换 | 第15-16页 |
2.2.3 数据规约 | 第16-18页 |
2.3 几种典型的机器学习算法简介 | 第18-21页 |
2.3.1 Bagging与AdaBoost | 第18-19页 |
2.3.2 随机森林(Random forest) | 第19页 |
2.3.3 支持向量机(SVM) | 第19-20页 |
2.3.4 人工神经网络 | 第20-21页 |
2.4 本章小结 | 第21-22页 |
3 基于IOC属性排序的快速选择方法 | 第22-26页 |
3.1 引言 | 第22页 |
3.2 输入输出关联法(IOC) | 第22-23页 |
3.3 类二分法方法 | 第23-24页 |
3.4 本章小结 | 第24-26页 |
4 通信企业用户在网离网大数据分析与预测 | 第26-39页 |
4.1 引言 | 第26-27页 |
4.2 数据采集 | 第27-28页 |
4.3 数据探索与预处理 | 第28-33页 |
4.4 数据分析挖掘 | 第33-37页 |
4.5 结果展示 | 第37-38页 |
4.6 本章小结 | 第38-39页 |
5 结论与展望 | 第39-41页 |
致谢 | 第41-42页 |
参考文献 | 第42-45页 |
附录 | 第45页 |
A. 攻读硕士学位期间发表的论文 | 第45页 |