首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

基于谱图理论的强化学习研究

致谢第1-5页
摘要第5-7页
Abstract第7-10页
Extended Abstract第10-13页
目录第13-17页
图清单第17-20页
表清单第20-21页
变量注释表第21-22页
1 绪论第22-40页
   ·研究背景第22-23页
   ·课题来源第23页
   ·国内外研究现状第23-36页
   ·论文研究思路、方法及内容第36-38页
   ·论文的结构和内容第38-40页
2 强化学习和谱图理论第40-53页
   ·强化学习理论第40-45页
   ·谱图理论及其应用第45-48页
   ·流形学习和距离度量学习第48-50页
   ·基于拉普拉斯特征映射的强化学习第50-52页
   ·小结第52-53页
3 基于谱图理论的 Option 自动生成第53-76页
   ·基于谱图理论的 Option 方法第54-57页
   ·基于谱图分割的 Option 自动生成算法第57-58页
   ·基于多路谱图分割的 Option 自动生成算法第58-66页
   ·仿真实验与分析第66-75页
   ·小结第75-76页
4 基于谱图理论的启发式回报函数设计第76-97页
   ·基于距离度量学习的启发式强化学习第77-78页
   ·启发式回报函数设计概述第78-80页
   ·基于拉普拉斯特征映射的距离度量法第80-84页
   ·基于多路谱图分割的抽象模型法第84-87页
   ·两类方法的对比分析第87-90页
   ·仿真实验与分析第90-96页
   ·小结第96-97页
5 基于谱图理论的启发式策略选择和 Dyna 规划第97-109页
   ·探索和利用平衡问题第97-98页
   ·基于谱图理论的启发式策略选择第98-103页
   ·Dyna 学习框架第103-104页
   ·基于谱图理论的 Dyna_Q 算法第104-107页
   ·小结第107-109页
6 基于谱图理论的强化学习迁移第109-123页
   ·强化学习迁移概述第110-111页
   ·基于谱图理论的强化学习迁移第111-112页
   ·基于谱图理论的强化学习混合迁移方法第112-116页
   ·算法步骤和适用范围第116-117页
   ·仿真实验与分析第117-122页
   ·小结第122-123页
7 总结与展望第123-125页
   ·总结第123-124页
   ·展望第124-125页
参考文献第125-140页
附录 1:线性插值所得基函数的线性无关性证明第140-141页
作者简历第141-144页
学位论文数据集第144页

论文共144页,点击 下载论文
上一篇:光伏发电系统运行理论与关键技术研究
下一篇:基于基因表达数据的肿瘤分类算法研究