摘要 | 第4-5页 |
Abstract | 第5-6页 |
第1章 绪论 | 第9-17页 |
1.1. 课题的来源及研究的目的和意义 | 第9-13页 |
1.1.1. 多点序列推荐 | 第10-11页 |
1.1.2. 基于偏好和上下文的个性化推荐 | 第11-12页 |
1.1.3. 多 agent 环境下的序列推荐 | 第12-13页 |
1.2. 国内外研究现状 | 第13-15页 |
1.2.1. 移动环境下推荐系统及其相关领域的国内外研究现状 | 第13-14页 |
1.2.2. 存在的问题 | 第14-15页 |
1.3. 本文的研究内容 | 第15-16页 |
1.3.1. 多点序列推荐 | 第15-16页 |
1.3.2. 基于偏好和上下文的个性化序列推荐 | 第16页 |
1.3.3. 多 agent 环境下的序列推荐 | 第16页 |
1.4. 本文的组织结构 | 第16-17页 |
第2章 多点序列推荐 | 第17-28页 |
2.1. 引言 | 第17页 |
2.2. 出租车载客地点序列推荐模型的建立 | 第17-22页 |
2.2.1. 状态集合的建立 | 第19-20页 |
2.2.2. 动作集合的建立 | 第20页 |
2.2.3. 转移函数的建立 | 第20-21页 |
2.2.4. 回报函数的建立 | 第21-22页 |
2.2.5. 折价因子的建立 | 第22页 |
2.3. 出租车载客地点序列推荐模型的求解 | 第22-24页 |
2.3.1. 值迭代算法 | 第22-23页 |
2.3.2. 策略迭代算法 | 第23-24页 |
2.4. 实验分析 | 第24-27页 |
2.4.1. 数据来源 | 第24页 |
2.4.2. 数据预处理 | 第24-25页 |
2.4.3. 实验结果 | 第25-27页 |
2.5. 本章小结 | 第27-28页 |
第3章 基于偏好和上下文的个性化序列推荐 | 第28-39页 |
3.1. 引言 | 第28-29页 |
3.2. 出租车司机行为偏好的学习模型 | 第29-36页 |
3.2.1. 逆向增强学习模型 | 第31-33页 |
3.2.2. 学徒学习模型 | 第33-36页 |
3.3. 实验分析 | 第36-38页 |
3.3.1. 数据预处理 | 第36-37页 |
3.3.2. 特征向量的建立 | 第37页 |
3.3.3. 实验结果 | 第37-38页 |
3.4. 本章小结 | 第38-39页 |
第4章 多 agent 环境下的序列推荐 | 第39-56页 |
4.1. 引言 | 第39-40页 |
4.2. 矩阵博弈 | 第40-42页 |
4.3. 随机博弈 | 第42-44页 |
4.3.1. 无限阶段随机博弈 | 第42-44页 |
4.3.2. 有限阶段随机博弈 | 第44页 |
4.4. 多 agent 环境下出租车载客地点序列推荐模型的建立 | 第44-50页 |
4.4.1. 问题引入 | 第44-45页 |
4.4.2. 随机博弈模型的建立 | 第45-50页 |
4.5. 多 agent 环境下出租车载客地点序列推荐模型的求解 | 第50-54页 |
4.5.1. 有限阶段纳什均衡策略算法 | 第51-52页 |
4.5.2. 基于稀疏采样技术的在线算法 | 第52-54页 |
4.6. 实验分析 | 第54-55页 |
4.7. 本章小结 | 第55-56页 |
结论 | 第56-57页 |
参考文献 | 第57-61页 |
攻读学位期间发表的学术论文 | 第61-63页 |
致谢 | 第63页 |