摘要 | 第1-5页 |
Abstract | 第5-9页 |
第一章 绪论 | 第9-22页 |
·多智能体系统 | 第9-15页 |
·智能体和多智能体系统 | 第9-12页 |
·多智能体系统研究主要内容及研究现状 | 第12-14页 |
·多智能体学习分类 | 第14-15页 |
·多智能体强化学习研究现状 | 第15-17页 |
·蚁群算法的研究现状 | 第17-19页 |
·蚁群算法与强化学习相结合 | 第19页 |
·课题研究的内容和意义 | 第19-20页 |
·论文的组织结构 | 第20-22页 |
第二章 强化学习和蚁群算法理论 | 第22-35页 |
·强化学习基本理论 | 第22-29页 |
·强化学习基本原理 | 第22-23页 |
·强化学习的特点与分类 | 第23-24页 |
·强化学习的主要方法 | 第24-28页 |
·强化学习主要应用 | 第28-29页 |
·蚁群算法基本理论 | 第29-34页 |
·蚁群算法基本思想 | 第29-30页 |
·基本蚁群算法原理 | 第30-31页 |
·蚁群算法基本数学模型 | 第31-32页 |
·蚁群算法系统学基本特征 | 第32-34页 |
·本章小结 | 第34-35页 |
第三章 结合蚁群算法自适应调整参数ρ更新信息素的 Q 学习 | 第35-46页 |
·多智能体 Q 学习存在的基本问题 | 第35-36页 |
·改进的 Q 学习算法 | 第36-38页 |
·基本 Q 学习动作策略 | 第36页 |
·基本蚁群算法信息素更新模式 | 第36-37页 |
·结合蚁群算法自适应调整参数ρ更新信息素的 Q 学习基本原理 | 第37-38页 |
·仿真实验与结果分析 | 第38-45页 |
·二维空间围捕模型 | 第38-41页 |
·仿真实验结果分析 | 第41-45页 |
·本章小结 | 第45-46页 |
第四章 结合蚁群算法自适应调整信息素强度的 Q 学习 | 第46-56页 |
·蚁群算法和 Q 学习内在联系 | 第46页 |
·改进的 Q 学习算法 | 第46-49页 |
·信息素更新策略基本模型 | 第46-47页 |
·结合蚁群算法自适应调整信息素强度的 Q 学习基本原理 | 第47-49页 |
·仿真实验与结果分析 | 第49-55页 |
·三维空间围捕模型 | 第49-52页 |
·仿真实验结果分析 | 第52-55页 |
·本章小结 | 第55-56页 |
第五章 几种算法性能对比 | 第56-60页 |
·仿真实验结果分析 | 第56-59页 |
·算法效率和成功率实验结果对比 | 第56-57页 |
·算法性能实验结果对比 | 第57-59页 |
·本章小结 | 第59-60页 |
第六章 总结与展望 | 第60-62页 |
·本文工作总结 | 第60-61页 |
·研究展望 | 第61-62页 |
参考文献 | 第62-65页 |
附录 攻读硕士学位期间撰写的论文 | 第65-66页 |
致谢 | 第66页 |