基于强化学习的客户调度算法及应用

摘要	第8-10页
ABSTRACT	第10-11页
第一章绪论	第12-18页
1.1 研究背景	第12-14页
1.2 本文主要工作和贡献	第14-16页
1.3 论文结构	第16-17页
1.4 本章小结	第17-18页
第二章相关工作	第18-28页
2.1 强化学习	第18-24页
2.1.1 马尔科夫决策过程	第19页
2.1.2 强化学习分类	第19-24页
2.2 流量预测	第24-25页
2.3 调度算法	第25页
2.4 客户调度	第25-26页
2.5 本章小结	第26-28页
第三章基于强化学习的客户派单算法	第28-46页
3.1 客户派单任务	第28-29页
3.1.1 客户派单算法功能	第28页
3.1.2 客户派单任务问题定义	第28-29页
3.2 客户派单算法整体架构	第29-32页
3.3 客户派单算法基础模型	第32-36页
3.3.1 数据处理	第32-34页
3.3.2 模型设计	第34-36页
3.4 基于强化学习的派单模型设计	第36-39页
3.4.1 动作	第37页
3.4.2 状态	第37-38页
3.4.3 奖励函数	第38页
3.4.4 终止状态	第38-39页
3.4.5 探索-开发	第39页
3.5 实验	第39-43页
3.5.1 实验设置	第39-41页
3.5.2 实验结果	第41-43页
3.6 本章小结	第43-46页
第四章基于强化学习的客户分流算法	第46-72页
4.1 客户分流任务	第46-47页
4.1.1 客户分流算法功能	第46页
4.1.2 客户分流任务问题定义	第46-47页
4.2 当前客户分流模型	第47-48页
4.3 客户分流算法整体架构	第48-50页
4.4 用户模型	第50-52页
4.4.1 数据处理	第50-52页
4.4.2 模型设计	第52页
4.5 基于强化学习的客户分流模型	第52-58页
4.5.1 动作	第53页
4.5.2 状态	第53页
4.5.3 奖励函数	第53-54页
4.5.4 终止状态	第54-55页
4.5.5 探索-开发	第55-56页
4.5.6 优先级经验池	第56页
4.5.7 基于强化学习的客户分流任务流程	第56-58页
4.6 客户分流任务实验	第58-64页
4.6.1 实验设置	第58-62页
4.6.2 客户流量预测	第62-64页
4.7 实验结果与分析	第64-69页
4.7.1 实验结果-合成数据	第64-65页
4.7.2 实验结果-真实数据	第65-69页
4.8 本章小结	第69-72页
第五章总结与展望	第72-74页
5.1 总结	第72-73页
5.2 展望	第73-74页
参考文献	第74-80页
致谢	第80-81页
学位论文评阅及答辩情况表	第81页