| 摘要 | 第1-6页 |
| ABSTRACT | 第6-14页 |
| 第一章 绪论 | 第14-26页 |
| ·引言 | 第14页 |
| ·强化学习的发展与现状 | 第14-16页 |
| ·Q-learning算法的基本知识 | 第16-19页 |
| ·Markov决策过程 | 第16页 |
| ·奖赏策略 | 第16-17页 |
| ·Q值函数 | 第17-18页 |
| ·动作选择机制 | 第18-19页 |
| ·Q-learning基本步骤 | 第19页 |
| ·Q-learning的优缺点 | 第19页 |
| ·补料分批发酵过程概述 | 第19-22页 |
| ·补料分批发酵过程 | 第20页 |
| ·发酵过程的一般特点 | 第20-21页 |
| ·分批补料发酵过程的多目标优化问题 | 第21-22页 |
| ·Q-learning算法在优化与控制中的应用 | 第22-23页 |
| ·本文的主要工作 | 第23-26页 |
| 第二章 离散化Q-learning算法的Pareto优化策略 | 第26-46页 |
| ·引言 | 第26页 |
| ·PDQL优化策略 | 第26-32页 |
| ·基于Q-learning的优化策略 | 第26-28页 |
| ·非支配集的构建方法 | 第28-30页 |
| ·优化策略的步骤 | 第30-32页 |
| ·PDQL的函数优化测试 | 第32-44页 |
| ·单一目标函数测试结果 | 第33-36页 |
| ·Fonseca函数测试 | 第36-39页 |
| ·Viennet函数测试 | 第39-40页 |
| ·Viennet(3)函数测试 | 第40-43页 |
| ·Deb g(x_2)函数测试 | 第43-44页 |
| ·本章小结 | 第44-46页 |
| 第三章 赖氨酸补料分批发酵过程多目标优化 | 第46-58页 |
| ·引言 | 第46页 |
| ·赖氨酸补料分批发酵过程模型 | 第46-48页 |
| ·优化目标与优化解 | 第48-51页 |
| ·优化步骤与比较算法 | 第51-53页 |
| ·优化结果与分析 | 第53-56页 |
| ·本章小结 | 第56-58页 |
| 第四章 多步Q-learning算法在发酵过程控制回路中的应用 | 第58-76页 |
| ·引言 | 第58页 |
| ·多步Q-learning控制器 | 第58-62页 |
| ·多步Q-learning算法 | 第58-60页 |
| ·多步Q-learning控制器设计 | 第60-62页 |
| ·多步Q-learning控制器在中和反应中的应用 | 第62-66页 |
| ·中和反应对象模型 | 第63-64页 |
| ·控制器设置 | 第64-65页 |
| ·控制结果与分析 | 第65-66页 |
| ·多步Q-learning控制器在温度控制中的应用 | 第66-74页 |
| ·酿酒酵母发酵过程温度控制模型 | 第67-70页 |
| ·温度控制器设置 | 第70-71页 |
| ·控制结果与分析 | 第71-74页 |
| ·本章小结 | 第74-76页 |
| 第五章 结论与展望 | 第76-78页 |
| 参考文献 | 第78-82页 |
| 致谢 | 第82-84页 |
| 研究成果及发表的学术论文 | 第84-86页 |
| 作者简介 | 第86-87页 |
| 硕士研究生学位论文答辩委员会决议书 | 第87-88页 |