首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

面向软件自适应演化中的强化学习方法的研究

摘要第1-4页
Abstract第4-7页
第一章 绪论第7-17页
   ·研究背景与意义第7-9页
   ·研究目标与内容第9-10页
   ·国内外研究现状与分析第10-14页
     ·软件自适应技术研究现状第10-12页
     ·强化学习技术研究现状第12-14页
   ·本文的组织结构第14-17页
第二章 相关理论与技术研究第17-25页
   ·软件自适应演化技术第17-18页
   ·强化学习技术第18-21页
     ·强化学习基本框架第18-19页
     ·优化行为模型第19-20页
     ·马尔可夫决策过程第20-21页
   ·常用的强化学习算法第21-23页
     ·TD 算法第21-22页
     ·Q 学习算法第22-23页
     ·DYNA 算法第23页
   ·本章小结第23-25页
第三章 基于 AGENT 的软件自适应演化支撑环境第25-35页
   ·基于 AGENT 的软件自适应演化支撑环境第25-28页
     ·支撑环境框架第25-27页
     ·支撑环境及工具第27-28页
   ·AGENT 分层组织结构第28-29页
   ·AGENT 模型第29-33页
     ·AGENT 元模型第30页
     ·功能 AGENT 模型第30-32页
     ·服务 AGENT 模型第32-33页
   ·本章小结第33-35页
第四章 环境感知与 AGENT 学习过程第35-39页
   ·环境感知第35-36页
     ·环境的形式化定义第35-36页
     ·感知器的设计第36页
   ·学习机的设计及 AGENT 工作学习过程第36-38页
     ·学习机的设计第36-37页
     ·AGENT 的学习过程第37-38页
   ·本章小结第38-39页
第五章 多 AGENT 强化学习方法的设计与实现第39-51页
   ·多 Agent 强化学习框架第39-41页
   ·交通灯控制 Agent 的设计与实现第41-43页
   ·知识规则定义及知识规则扩充机制第43-45页
     ·知识规则定义第43-44页
     ·知识规则的扩充机制第44-45页
   ·强化学习中 Q 学习方法的设计与实现第45-50页
     ·Q 值相关信号的确定第45-47页
     ·Q 值更新方法及 Q 值学习方法实现流程第47-50页
   ·本章小结第50-51页
第六章 应用案例与实验分析第51-63页
   ·实验目的第51页
   ·实验用例第51-61页
     ·用例介绍第51-53页
     ·实验设计第53-54页
     ·实验过程第54-60页
     ·结果分析第60-61页
   ·本章总结第61-63页
第七章 总结与展望第63-65页
致谢第65-67页
参考文献第67-71页
在研期间研究成果第71-72页

论文共72页,点击 下载论文
上一篇:改进的细胞自动机蚁群聚类方法及平台识别应用
下一篇:基于稀疏表示的乳腺图像病变区域检测