摘要 | 第1-6页 |
ABSTRACT | 第6-14页 |
第一章 绪论 | 第14-26页 |
·引言 | 第14页 |
·强化学习的发展与现状 | 第14-16页 |
·Q-learning算法的基本知识 | 第16-19页 |
·Markov决策过程 | 第16页 |
·奖赏策略 | 第16-17页 |
·Q值函数 | 第17-18页 |
·动作选择机制 | 第18-19页 |
·Q-learning基本步骤 | 第19页 |
·Q-learning的优缺点 | 第19页 |
·补料分批发酵过程概述 | 第19-22页 |
·补料分批发酵过程 | 第20页 |
·发酵过程的一般特点 | 第20-21页 |
·分批补料发酵过程的多目标优化问题 | 第21-22页 |
·Q-learning算法在优化与控制中的应用 | 第22-23页 |
·本文的主要工作 | 第23-26页 |
第二章 离散化Q-learning算法的Pareto优化策略 | 第26-46页 |
·引言 | 第26页 |
·PDQL优化策略 | 第26-32页 |
·基于Q-learning的优化策略 | 第26-28页 |
·非支配集的构建方法 | 第28-30页 |
·优化策略的步骤 | 第30-32页 |
·PDQL的函数优化测试 | 第32-44页 |
·单一目标函数测试结果 | 第33-36页 |
·Fonseca函数测试 | 第36-39页 |
·Viennet函数测试 | 第39-40页 |
·Viennet(3)函数测试 | 第40-43页 |
·Deb g(x_2)函数测试 | 第43-44页 |
·本章小结 | 第44-46页 |
第三章 赖氨酸补料分批发酵过程多目标优化 | 第46-58页 |
·引言 | 第46页 |
·赖氨酸补料分批发酵过程模型 | 第46-48页 |
·优化目标与优化解 | 第48-51页 |
·优化步骤与比较算法 | 第51-53页 |
·优化结果与分析 | 第53-56页 |
·本章小结 | 第56-58页 |
第四章 多步Q-learning算法在发酵过程控制回路中的应用 | 第58-76页 |
·引言 | 第58页 |
·多步Q-learning控制器 | 第58-62页 |
·多步Q-learning算法 | 第58-60页 |
·多步Q-learning控制器设计 | 第60-62页 |
·多步Q-learning控制器在中和反应中的应用 | 第62-66页 |
·中和反应对象模型 | 第63-64页 |
·控制器设置 | 第64-65页 |
·控制结果与分析 | 第65-66页 |
·多步Q-learning控制器在温度控制中的应用 | 第66-74页 |
·酿酒酵母发酵过程温度控制模型 | 第67-70页 |
·温度控制器设置 | 第70-71页 |
·控制结果与分析 | 第71-74页 |
·本章小结 | 第74-76页 |
第五章 结论与展望 | 第76-78页 |
参考文献 | 第78-82页 |
致谢 | 第82-84页 |
研究成果及发表的学术论文 | 第84-86页 |
作者简介 | 第86-87页 |
硕士研究生学位论文答辩委员会决议书 | 第87-88页 |