摘要 | 第1-8页 |
Abstract | 第8-16页 |
第1章 绪论 | 第16-24页 |
·研究背景及意义 | 第16-17页 |
·Agent自动协商 | 第17-20页 |
·协商的概念和分类 | 第17页 |
·协商协议 | 第17-18页 |
·协商策略 | 第18-20页 |
·本文主要研究内容 | 第20-22页 |
·论文组织结构 | 第22-24页 |
第2章 理论研究基础 | 第24-42页 |
·市场驱动代理模型 | 第24-27页 |
·学习方法介绍 | 第27-37页 |
·学习方法分类 | 第27-28页 |
·贝叶斯学习 | 第28-29页 |
·强化学习 | 第29-33页 |
·遗传算法 | 第33-35页 |
·人工神经网络 | 第35-36页 |
·各种学习方法对比 | 第36-37页 |
·模糊理论 | 第37-42页 |
·模糊集合及其运算 | 第37-39页 |
·模糊推理系统 | 第39-42页 |
第3章 基于双方出价满意度的多策略模糊推理协商模型 | 第42-62页 |
·引言 | 第42-43页 |
·多边多议题协商的信息表示 | 第43-44页 |
·协商出价满意度模糊集 | 第44-47页 |
·谈判者的谈判力评估 | 第44-46页 |
·第三方环境因素评估 | 第46页 |
·预测协商目标 | 第46-47页 |
·确定出价满意度模糊集 | 第47页 |
·产生总体让步值 | 第47-50页 |
·让步策略 | 第48-49页 |
·使用模糊推理产生总体让步 | 第49-50页 |
·利用相似性原则产生多议题出价方案 | 第50-54页 |
·双方提议相似度 | 第50-51页 |
·利用退火算法产生多议题出价 | 第51-52页 |
·利用贝叶斯方法学习对手对多议题的偏好 | 第52-54页 |
·自动协商过程 | 第54-56页 |
·实验与分析 | 第56-60页 |
·实验设置 | 第56-57页 |
·实验结果分析 | 第57-60页 |
·小结 | 第60-62页 |
第4章 基于市场驱动代理的多边多议题自动协商模型 | 第62-68页 |
·引言 | 第62页 |
·基于市场驱动代理的多边自动协商框架 | 第62-63页 |
·自动协商过程 | 第63-64页 |
·实验与分析 | 第64-67页 |
·实验设置 | 第64-65页 |
·实验结果分析 | 第65-67页 |
·小结 | 第67-68页 |
第5章 基于分布式强化学习的自动协商策略 | 第68-84页 |
·引言 | 第68-69页 |
·分布式强化学习 | 第69-72页 |
·Markov对策 | 第69页 |
·常见分布式强化学习算法 | 第69-72页 |
·改进的WoLF PHC 算法 | 第72-74页 |
·基于分布式强化学习的自动协商模型框架 | 第74-77页 |
·实验与分析 | 第77-83页 |
·实验设置 | 第77-79页 |
·实验结果分析 | 第79-83页 |
·小结 | 第83-84页 |
第6章 基于模糊神经网络的自动协商策略 | 第84-96页 |
·引言 | 第84-85页 |
·基于Takagi-Sugeno推理的模糊神经网络 | 第85-87页 |
·模糊神经网络分层结构框架 | 第85-86页 |
·模糊神经网络的学习算法 | 第86-87页 |
·基于模糊神经网络的自动协商模型 | 第87-90页 |
·自动协商模型结构 | 第87-88页 |
·模糊神经网络设计 | 第88-89页 |
·产生让步率动作 | 第89-90页 |
·自动协商策略算法 | 第90页 |
·实验与分析 | 第90-93页 |
·实验设置 | 第90-92页 |
·实验结果分析 | 第92-93页 |
·小结 | 第93-96页 |
第7章 基于Actor-Critic强化学习的自动协商策略 | 第96-108页 |
·引言 | 第96-97页 |
·利用模糊神经网络生成Actor执行器和Ctiric评价器 | 第97-103页 |
·利用遗传算法优化Actor神经网络连接参数 | 第99-101页 |
·Actor-Critic模糊神经网络学习算法 | 第101-103页 |
·基于Actor-Critic强化学习的自动协商模型 | 第103-105页 |
·实验与分析 | 第105-106页 |
·实验设置 | 第105页 |
·实验结果分析 | 第105-106页 |
·小结 | 第106-108页 |
第8章 总结与展望 | 第108-110页 |
参考文献 | 第110-120页 |
作者简介及在学期间所取得的科研成果 | 第120-122页 |
致谢 | 第122页 |