基于上下文无休止多臂赌博机模型的推荐算法研究

摘要	第4-6页
abstract	第6-7页
第1章绪论	第11-17页
1.1 研究背景	第11-16页
1.1.1 研究意义	第12-13页
1.1.2 研究现状	第13-16页
1.2 论文组织结构	第16-17页
第2章相关研究介绍	第17-27页
2.1 多臂赌博机问题(MAB)介绍	第17-18页
2.2 上下文多臂赌博机问题(CMAB)介绍	第18-22页
2.2.1 基于CMAB模型的LinUCB算法	第19-20页
2.2.2 基于CMAB模型的LinTS算法	第20-22页
2.3 无休止多臂赌博机问题(RMAB)介绍	第22-26页
2.3.1 马尔科夫决策过程	第22-23页
2.3.2 基于RMAB模型的推荐算法研究	第23-26页
2.4 本章小结	第26-27页
第3章基于上下文无休止多臂赌博机模型的推荐算法	第27-41页
3.1 基于上下文多臂赌博机模型的推荐算法存在的问题	第27-28页
3.2 对基于线性收益CMAB模型的汤普森采样算法的改进	第28-39页
3.2.1 基于CMAB模型的LinTS算法存在的问题	第28-29页
3.2.2 结合协同信息的线性上下文收益	第29-30页
3.2.3 为项目定义状态和转移规则	第30-33页
3.2.4 基于CRMAB模型的算法的推荐策略	第33-36页
3.2.5 基于汤普森采样算法的参数学习	第36-39页
3.3 基于上下文无休止多臂赌博机模型的推荐算法描述	第39-40页
3.4 本章小结	第40-41页
第4章实验及结果分析	第41-52页
4.1 实验数据介绍	第41-42页
4.2 数据预处理	第42页
4.3 实验系统与环境	第42页
4.4 实验设置	第42-43页
4.5 冷启动实验	第43-46页
4.5.1 冷启动试验中的累计遗憾情况	第43-45页
4.5.2 冷启动实验中的覆盖率情况	第45-46页
4.6 热启动实验	第46-49页
4.6.1 热启动实验中的累计遗憾情况	第46-48页
4.6.2 热启动实验中的覆盖率情况	第48-49页
4.7 实验结果与分析	第49-51页
4.8 本章小结	第51-52页
第5章总结与展望	第52-54页
5.1 本文工作总结	第52-53页
5.2 进一步工作展望	第53-54页
参考文献	第54-58页
作者简介及在学期间所取得的科研成果	第58-59页
致谢	第59页