摘要 | 第4-6页 |
Abstract | 第6-8页 |
第一章 绪论 | 第12-26页 |
1.1 问题的提出及研究的意义 | 第12-13页 |
1.2 研究回顾 | 第13-22页 |
1.2.1 博弈中的信息问题 | 第13-15页 |
1.2.2 博弈中的理性问题 | 第15-17页 |
1.2.3 博弈均衡理论的形成和发展 | 第17-22页 |
1.3 研究目的与论文结构 | 第22-24页 |
1.3.1 本文研究的目的 | 第22页 |
1.3.2 论文的结构与内容 | 第22-24页 |
1.4 研究方法和创新思路 | 第24-26页 |
1.4.1 研究方法和技术路线 | 第24页 |
1.4.2 研究的创新思路 | 第24-26页 |
第二章 博弈要素分析与均衡 | 第26-36页 |
2.1 博弈组成要素分析 | 第26-29页 |
2.1.1 博弈主体 | 第26-28页 |
2.1.2 博弈语境 | 第28页 |
2.1.3 博弈信号 | 第28-29页 |
2.2 博弈主体的特征分析 | 第29-32页 |
2.2.1 效用最大化 | 第29-30页 |
2.2.2 策略空间和效用函数的两重属性 | 第30-31页 |
2.2.3 策略选择方法 | 第31-32页 |
2.3 博弈均衡 | 第32-34页 |
2.3.1 博弈均衡 | 第32-33页 |
2.3.2 均衡的分析方法 | 第33-34页 |
2.4 博弈均衡的动态表示方法 | 第34-35页 |
2.5 小结 | 第35-36页 |
第三章 信息的分布式描述与理性的形式化表示 | 第36-52页 |
3.1 基于熵与灰数灰度的信息量测度方法 | 第36-37页 |
3.2 信息的分布式描述方法 | 第37-40页 |
3.2.1 确立信息的描述主题 | 第37-38页 |
3.2.2 构造主题的事件类型 | 第38-39页 |
3.2.3 确定事件的统计概率 | 第39-40页 |
3.3 二维信息模型 | 第40-44页 |
3.3.1 信息的二维背景 | 第40页 |
3.3.2 基于时间维的深度信息 | 第40-41页 |
3.3.3 基于空间维的广度信息 | 第41-43页 |
3.3.4 信息深度和广度对学习效用的影响 | 第43-44页 |
3.4 理性的本质与形式化表示 | 第44-47页 |
3.4.1 理性的本质 | 第44-45页 |
3.4.2 理性的形式化表示 | 第45-47页 |
3.5 有限理性与演化 | 第47-50页 |
3.5.1 有限理性的特征 | 第47-49页 |
3.5.2 理性演化 | 第49-50页 |
3.6 对称理性与群体理性 | 第50-51页 |
3.7 小结 | 第51-52页 |
第四章 基于占优理性的互制均衡与互利均衡 | 第52-59页 |
4.1 占优理性 | 第52-53页 |
4.1.1 占优战略与占优均衡 | 第52页 |
4.1.2 占优理性 | 第52-53页 |
4.2 互制均衡与互利均衡 | 第53-56页 |
4.2.1 互制均衡 | 第53-54页 |
4.2.2 互利均衡 | 第54-56页 |
4.3 多态均衡的行为动态分析 | 第56-58页 |
4.4 小结 | 第58-59页 |
第五章 基于学习训练和第三方过滤的期望均衡 | 第59-79页 |
5.1 期望均衡 | 第59-61页 |
5.1.1 帕累托定态与均衡优化 | 第59-60页 |
5.1.2 期望均衡 | 第60-61页 |
5.2 博弈学习 | 第61-63页 |
5.2.1 博弈学习 | 第61-62页 |
5.2.2 基于历史的博弈学习 | 第62-63页 |
5.3 博弈学习的基本模式 | 第63-68页 |
5.3.1 基于收益流行的模仿学习 | 第64-65页 |
5.3.2 基于策略分布的反应学习 | 第65-68页 |
5.4 博弈训练与跟进学习 | 第68-72页 |
5.4.1 博弈训练的基本概念 | 第68-69页 |
5.4.2 博弈训练的功能 | 第69-70页 |
5.4.3 博弈训练的原则 | 第70-71页 |
5.4.4 基于一致预期的跟进学习 | 第71-72页 |
5.5 基于训练的期望均衡实现 | 第72-74页 |
5.5.1 角色分配 | 第72-73页 |
5.5.2 期望揭示 | 第73页 |
5.5.3 期望认同 | 第73-74页 |
5.6 基于第三方过滤器的期望均衡及其实现 | 第74-78页 |
5.6.1 第三方期望均衡 | 第74-75页 |
5.6.2 第三方过滤器 | 第75-77页 |
5.6.3 第三方期望均衡的实现 | 第77-78页 |
5.7 小结 | 第78-79页 |
第六章 语境和信息对占优均衡效率的影响 | 第79-88页 |
6.1 理想博弈均衡与博弈内耗 | 第79-80页 |
6.2 语境对博弈均衡效率的影响 | 第80-83页 |
6.2.1 联合垄断的决策效用 | 第80-81页 |
6.2.2 库诺特寡头竞争模型的决策效用 | 第81页 |
6.2.3 斯坦克尔伯格产量竞争模型的决策效用 | 第81-82页 |
6.2.4 不同语境下的效用比较 | 第82-83页 |
6.3 信息对博弈均衡效用的影响 | 第83-87页 |
6.3.1 信息的评价 | 第83页 |
6.3.2 不同信息条件下的博弈效用分析 | 第83-85页 |
6.3.3 博弈均衡中的信息无效性分析 | 第85-87页 |
6.4 小结 | 第87-88页 |
第七章 基于不同理性的博弈均衡动态分析 | 第88-100页 |
7.1 理性的评价 | 第88-89页 |
7.1.1 效用理性和计算理性 | 第88页 |
7.1.2 博弈语境是理性评价的基础 | 第88-89页 |
7.2 基于简易模仿和训练的“囚徒困境”动态分析 | 第89-96页 |
7.2.1 基于简易模仿的“囚徒困境”对称动态分析 | 第89-91页 |
7.2.2 基于简易训练的模仿动态分析 | 第91-93页 |
7.2.3 基于简易训练的跟进动态分析 | 第93-96页 |
7.3 IPD反应动态仿真分析与启示 | 第96-99页 |
7.3.1 基于主体的博弈学习仿真工具 | 第96页 |
7.3.2 IPD 计算机模型概述 | 第96-97页 |
7.3.3 IPD 的仿真分析与启示 | 第97-99页 |
7.4 小结 | 第99-100页 |
第八章 结论与展望 | 第100-103页 |
8.1 主要结论 | 第100-101页 |
8.2 存在问题和改进方向 | 第101-103页 |
参考文献 | 第103-111页 |
致谢 | 第111-112页 |
在学期间的研究成果及发表的学术论文 | 第112页 |