摘要 | 第5-6页 |
Abstract | 第6页 |
第1章 绪论 | 第9-19页 |
1.1 引言 | 第9-10页 |
1.2 本文主要思想 | 第10-15页 |
1.2.1 随机优化算法的简介 | 第10-13页 |
1.2.2 强化学习思想简介 | 第13-14页 |
1.2.3 植物散播思想的提出与简介 | 第14-15页 |
1.3 国内外研究现状 | 第15-18页 |
1.3.1 随机优化算法的研宄现状 | 第15-17页 |
1.3.2 强化学习的研究现状 | 第17-18页 |
1.4 本文的内容安排 | 第18-19页 |
第2章 随机优化算法收敛性的说明性证明与验证 | 第19-32页 |
2.1 几种随机优化算法的数学模型 | 第19-22页 |
2.1.1 粒子群算法简介 | 第19-20页 |
2.1.2 模拟退火算法简介 | 第20页 |
2.1.3 遗传算法简介 | 第20-21页 |
2.1.4 人工鱼群算法简介 | 第21-22页 |
2.2 随机优化算法的收敛性分析 | 第22-28页 |
2.2.1 孤立极值点 | 第23-24页 |
2.2.2 单峰 | 第24页 |
2.2.3 单峰内随机优化算法的收敛性 | 第24-26页 |
2.2.4 局部收敛与全局收敛 | 第26页 |
2.2.5 局部不收敛的随机优化算法的全局收敛性 | 第26-27页 |
2.2.6 典型随机优化算法的收敛性讨论 | 第27-28页 |
2.3 随机优化算法的收敛性条件验证 | 第28-30页 |
2.3.1 收敛条件一的分析 | 第28-29页 |
2.3.2 收敛条件二的实验验证 | 第29-30页 |
2.4 本章小结 | 第30-32页 |
第3章 基于随机优化思想的强化学习优化算法的构造 | 第32-44页 |
3.1 强化学习优化算法 | 第32-34页 |
3.2 强化学习优化算法仿真实验 | 第34-42页 |
3.2.1 —维函数寻优 | 第34-38页 |
3.2.1.1 强化学习优化算法的仿真实验 | 第35-36页 |
3.2.1.2 与典型寻优算法误差对比 | 第36-38页 |
3.2.2 多维函数寻优 | 第38-42页 |
3.2.2.1 强化学习优化算法实验测试 | 第39-41页 |
3.2.2.2 与典型寻优算法误差对比 | 第41-42页 |
3.3 与遗传算法和粒子群算法的比较 | 第42-43页 |
3.4 本章小结 | 第43-44页 |
第4章 植物散播优化算法的提出及其在组合优化问题上的应用 | 第44-58页 |
4.1 植物散播优化算法 | 第44-50页 |
4.1.1 一维植物散播优化算法实验测试 | 第46-48页 |
4.1.2 多维植物散播优化算法实验测试 | 第48-50页 |
4.2 植物散播优化算法在组合优化中的应用 | 第50-57页 |
4.2.1 组合优化问题的数学描述 | 第51页 |
4.2.2 旅行商问题的数学描述 | 第51-52页 |
4.2.3 组合优化算法中的植物散播优化算法 | 第52-53页 |
4.2.4 算法测试实验 | 第53-57页 |
4.3 结论 | 第57-58页 |
第5章 随机优化算法的应用研宄 | 第58-72页 |
5.1 基于强化学习优化算法的电价预测 | 第58-67页 |
5.1.1 RLOA-BP算法的模型 | 第60-61页 |
5.1.2 模型的仿真验证 | 第61-67页 |
5.2 基于随机优化算法的参数辨识 | 第67-70页 |
5.2.1 基于强化学习优化算法的参数辨识 | 第68-69页 |
5.2.2 基于植物散播优化算法的参数辨识 | 第69-70页 |
5.3 本章小结 | 第70-72页 |
第6章 随机优化与强化学习思想在控制问题应用中的研究 | 第72-84页 |
6.1 控制算法的具体实现 | 第72-78页 |
6.1.1 学习算法的状态分割 | 第73-74页 |
6.1.2 关系网络 | 第74-75页 |
6.1.3 输出选择策略 | 第75-76页 |
6.1.4 关系网络的更新运算 | 第76-77页 |
6.1.5 收敛性 | 第77-78页 |
6.2 策略空间随机优化算法寻优 | 第78-80页 |
6.3 实验结果与分析 | 第80-83页 |
6.4 本章小结 | 第83-84页 |
第7章 总结与展望 | 第84-86页 |
7.1 总结 | 第84页 |
7.2 展望 | 第84-86页 |
参考文献 | 第86-90页 |
作者简历 | 第90-91页 |
致谢 | 第91页 |