摘要 | 第5-6页 |
abstract | 第6-7页 |
第一章 绪论 | 第11-18页 |
1.1 课题研究背景及意义 | 第11-12页 |
1.2 运营商大数据及应用模式简介 | 第12-13页 |
1.3 运营商大数据的国内外研究现状 | 第13-16页 |
1.3.1 运营商大数据在国外的研究现状 | 第14-15页 |
1.3.2 运营商大数据在国内的研究现状 | 第15-16页 |
1.4 本文主要工作 | 第16页 |
1.5 论文结构 | 第16-18页 |
第二章 关键技术研究与改进 | 第18-56页 |
2.1 随机森林关键技术与基础理论 | 第18-24页 |
2.1.1 决策树之CART | 第18-20页 |
2.1.2 决策树过拟合问题 | 第20页 |
2.1.3 组合分类器Bagging | 第20-22页 |
2.1.4 随机森林 | 第22-24页 |
2.2 基于综合不放回抽样的随机森林算法改进 | 第24-48页 |
2.2.1 训练样本量对组合分类模型准确率的影响研究 | 第25-30页 |
2.2.2 Bagging抽样倍数对准确率的影响研究 | 第30-35页 |
2.2.3 样本不平衡度对准确率的影响研究 | 第35-40页 |
2.2.4 随机森林效率提升研究 | 第40-45页 |
2.2.5 综合不放回抽样改进 | 第45-48页 |
2.2.6 综合算法改进总结 | 第48页 |
2.3 样本不平衡度与算法取样倍数回归分析 | 第48-54页 |
2.4 聚类分析技术 | 第54页 |
2.5 数理统计方法 | 第54-55页 |
2.6 本章小结 | 第55-56页 |
第三章 系统需求分析 | 第56-72页 |
3.1 整体需求概述 | 第56-57页 |
3.2 可行性分析 | 第57页 |
3.3 业务需求分析 | 第57-67页 |
3.3.1 数据采集业务流程规划与分析 | 第58-60页 |
3.3.2 数据预处理业务流程规划与分析 | 第60-63页 |
3.3.3 数据分析业务流程规划与分析 | 第63-65页 |
3.3.4 反馈调整业务流程规划与分析 | 第65-67页 |
3.4 需求收集用例图 | 第67-71页 |
3.4.1 数据采集用例 | 第67-68页 |
3.4.2 数据预处理用例 | 第68-69页 |
3.4.3 数据分析用例 | 第69-71页 |
3.4.4 反馈调整用例 | 第71页 |
3.5 本章小结 | 第71-72页 |
第四章 系统设计 | 第72-95页 |
4.1 系统架构 | 第72-73页 |
4.2 物理部署 | 第73-74页 |
4.3 总体结构 | 第74-75页 |
4.4 系统包图 | 第75-76页 |
4.5 系统类图 | 第76-87页 |
4.5.1 公共资源 | 第76-78页 |
4.5.2 数据采集 | 第78-80页 |
4.5.3 数据预处理 | 第80-83页 |
4.5.4 数据分析 | 第83-87页 |
4.5.5 反馈调整 | 第87页 |
4.6 用例实现 | 第87-94页 |
4.6.1 数据采集子系统用例实现 | 第87-88页 |
4.6.2 数据预处理子系统用例实现 | 第88-90页 |
4.6.3 数据分析子系统用例实现 | 第90-93页 |
4.6.4 反馈调整子系统用例实现 | 第93-94页 |
4.7 本章小结 | 第94-95页 |
第五章 系统测试与分析 | 第95-107页 |
5.1 运营商话单数据描述 | 第95页 |
5.2 房产经纪人信息采集测试 | 第95-96页 |
5.3 话单过滤测试 | 第96-97页 |
5.4 数据分析测试 | 第97-106页 |
5.4.1 类别预估及测试维度选取 | 第97页 |
5.4.2 测试样本选取 | 第97-98页 |
5.4.3 训练样本获取测试及分析 | 第98-103页 |
5.4.4 改进随机森林分类测试及分析 | 第103-106页 |
5.5 本章小结 | 第106-107页 |
第六章 总结与展望 | 第107-109页 |
6.1 总结 | 第107页 |
6.2 展望 | 第107-109页 |
致谢 | 第109-110页 |
参考文献 | 第110-113页 |
攻硕期间取得的研究成果 | 第113-114页 |