多Agent激励学习方法及其在电商报价系统中的应用

摘要	第1-5页
Abstract	第5-9页
1 绪论	第9-14页
·选题的背景与意义	第9-11页
·MAS的应用与发展	第9-10页
·电力市场环境下的报价策略问题	第10页
·课题的研究意义	第10-11页
·国内外研究现状	第11-13页
·MAS的研究现状	第11-12页
·电力市场报价决策方法研究现状	第12页
·将MAS技术引入电力市场的研究现状	第12-13页
·本文的主要内容	第13-14页
2 MAS基本理论	第14-22页
·Agent概述	第14-16页
·Agent概念	第14-15页
·Agent具有的特性	第15-16页
·Agent分类	第16页
·MAS概述	第16-19页
·Multi-agent概念	第16-17页
·MAS研究内容	第17页
·多Agent系统的应用及发展	第17-19页
·Agent学习及其方法	第19-22页
·Agent的学习	第19-20页
·Agent的学习方法	第20页
·多Agent的学习	第20-22页
3 多Agent激励学习方法	第22-33页
·激励学习	第22-26页
·激励学习原理	第22-23页
·激励学习要素	第23-25页
·激励学习方法	第25-26页
·随机对策	第26-30页
·Markov决策过程	第26-27页
·优化策略	第27-29页
·随机对策	第29-30页
·多Agent激励学习	第30-33页
·单Agent与多Agent激励学习	第30-31页
·探索和利用	第31-33页
4 Q-学习算法研究	第33-44页
·Q-学习	第33-35页
·Q-学习原理	第33-34页
·单Agent Q-学习	第34-35页
·多Agent Q-学习	第35页
·零和随机对策下的Minimax-Q学习	第35-36页
·常和随机对策下的Q-学习	第36-39页
·Nash Q-学习	第36页
·Friend-or-Foe Q-学习	第36-37页
·CE Q-学习	第37-38页
·策略爬山WoLF	第38-39页
·基于非Markov的多Agent激励学习算法	第39-44页
·改进的多Agent激励学习算法	第39-40页
·算法的实现	第40-42页
·仿真实验及结果	第42-44页
5 量子算法的研究	第44-52页
·量子计算	第44-46页
·量子计算简介	第44-45页
·量子位	第45页
·Walsh-Hadamard变换	第45-46页
·量子搜索算法	第46-48页
·量子搜索算法思想	第46页
·Grover量子搜索算法	第46-47页
·Grover迭代	第47-48页
·多Agent量子激励学习	第48-52页
·状态和行为描述	第48页
·多Agent量子激励学习过程	第48-49页
·仿真实验及结果	第49-52页
6 基于多Agent激励学习的发电报价策略	第52-58页
·基于MAS的电力市场模型	第52-53页
·电力市场基本主体	第52页
·市场主体的学习过程	第52-53页
·基于多Agent的发电商联合报价	第53页
·基于多Agent的发电商决策报价方法研究	第53-57页
·问题简述	第53-54页
·模型建立	第54页
·发电商报价学习算法设计	第54页
·算法参数设定	第54-55页
·仿真实验及结果	第55-57页
·小结	第57-58页
结论	第58-59页
参考文献	第59-62页
致谢	第62-63页