摘要 | 第1-6页 |
ABSTRACT | 第6-10页 |
第1章 绪论 | 第10-23页 |
·选题背景及意义 | 第10-11页 |
·气候合作策略概述 | 第11-12页 |
·多Agent 及Q 学习算法概述 | 第12-17页 |
·多Agent 概述 | 第12-13页 |
·Q 学习算法概述 | 第13-17页 |
·国内外研究现状 | 第17-21页 |
·气候合作策略的国内外研究现状 | 第17-19页 |
·多Agent 及Q 学习算法的国内外研究现状 | 第19-21页 |
·研究工作和论文组织 | 第21-23页 |
第2章 基于 Meta 平衡的多 Agent Q 学习算法研究 | 第23-31页 |
·引言 | 第23-24页 |
·多Agent Q 学习算法 | 第24-25页 |
·多Agent MetaQ 算法 | 第25-28页 |
·Meta 平衡 | 第25页 |
·Meta 平衡集的计算 | 第25-26页 |
·MetaQ 算法 | 第26-27页 |
·MetaQ 算法性能分析 | 第27-28页 |
·算法仿真及结果分析 | 第28-30页 |
·小结 | 第30-31页 |
第3章 基于 NashQ 算法的气候合作策略研究与仿真 | 第31-41页 |
·引言 | 第31页 |
·相关模型 | 第31-32页 |
·算法设计目标 | 第31-32页 |
·投资模型 | 第32页 |
·惩罚模型 | 第32页 |
·NashQ 算法原理 | 第32-37页 |
·算法介绍 | 第32-33页 |
·动作预测方法 | 第33-35页 |
·算法描述 | 第35-37页 |
·基于NashQ 算法的气候合作策略的仿真结果分析 | 第37-40页 |
·仿真环境 | 第37页 |
·仿真结果分析 | 第37-40页 |
·小结 | 第40-41页 |
第4章 基于 MetaQ 算法的气候合作策略研究与仿真 | 第41-50页 |
·引言 | 第41页 |
·MetaQ 值的计算 | 第41-42页 |
·基于MetaQ 算法的气候合作策略的仿真结果分析 | 第42-49页 |
·小结 | 第49-50页 |
第5章 气候合作策略仿真系统设计与实现 | 第50-58页 |
·引言 | 第50页 |
·仿真系统设计 | 第50-53页 |
·仿真系统功能模块设计 | 第50-51页 |
·数据库设计 | 第51-53页 |
·仿真系统实现 | 第53-57页 |
·小结 | 第57-58页 |
第6章 总结与展望 | 第58-60页 |
·总结 | 第58页 |
·展望 | 第58-60页 |
参考文献 | 第60-64页 |
致谢 | 第64-65页 |
攻读学位期间参加的科研项目和成果 | 第65页 |