动态博弈学习

更新时间:2023-10-24 02:36:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第8讲 完美信息动态博弈 第一节完美信息动态博弈的特点与解法

1动态博弈的表示方法——扩展型

动态博弈涉及博弈的参与人多个阶段的选择和选择的顺序问题,一般难以用策略型表示,而多用扩展型——也称博弈树——表示(有限博弈)。 以仿冒与反仿冒为例。 一些名词:

参与人和行动顺序:

结点:决策结——参与人决策的点;终点结

支付向量:先行动的人的支付排第一,后行动的人的支付排第二......

信息集:在完美信息的情况下,处于某一节点的参与人对这个结点之前的信息都是了解的。所有的信息集都是单结的。 (根据参与人是否相互了解支付情况,有完全信息和不完全信息博弈之分,根据是否所有参与人都对自己选择前的博弈过程完全了解,由完美信息与不完美信息博弈之分。) 路径:第一阶段A仿冒,第二阶段B不制止,第三阶段A仿冒,第四阶段B制止。

2可信性与纳什均衡的问题

纳什均衡在动态博弈中不再适用。因为:承诺和威胁的可信性

1

问题。

例:开金矿博弈

B有一价值4万元的金矿缺一万元资金。A有一万元资金。B承诺如果A将资金借给他,金矿开采后收益对半分成。问题:A是否应该借给她?

如果博弈进行到第二阶段,B的合理行动是“不分”,承诺是不可信的。考虑到这一点,A在第一阶段选择“不借”。

如果在B不分时A选择打官司。情况就是:

如果打官司 非常劳民伤财,则打官司的威胁就是不可信的。情况就是:

所以,承诺或威胁是否可信对于博弈的结果有很大的影响。 由于存在可信性问题,纳什均衡不再是动态博弈的适合的均衡解。

看第三种情况。策略组合A:第一阶段选择“借”,第三阶段“打”;B:第二阶段“分”是一个纳什均衡。 证明:给定A的策略,B“分”是最佳选择;

给定B“分”的策略,A第一阶段借,第三阶段打是最佳选择(第三阶段打不需要实施,但是它是保证B分的关键,因而A的策略必须包括第三阶段打的策略)

但是这个纳什均衡不具有稳定性不具有一致预测性。这是因

2

为,如果B在第二阶段选择了“不分”,A“打”的威胁是不可信的。这样B不会遵守承诺,A也不会愚蠢到依靠一个不可信的威胁冒险将资金借给他。

由于纳什均衡不能排除参与人策略中不可信的威胁和承诺,因而是不稳定的,在分析动态博弈时不能给出一致性的预测。所以动态博弈中的需要寻找新的均衡概念(子博弈精炼纳时均衡)。

3动态博弈的解法:逆向归纳法

从上面的例子中可以看出动态博弈的适合的解法是逆向归纳法(backwards induction):从博弈的最后一个阶段参与人的行为开始分析,逐步倒退回前一阶段相应参与人的行为......一直到第一阶段。

逆向归纳法的逻辑基础:动态博弈中先行动的参与人,在前面阶段选择行为时必然会考虑后行动的参与人在后面阶段中的行为选择,只有在最后一阶段的参与人才能不受其他参与人的制约而直接做出选择。而当后面阶段的参与人的选择确定后,前一阶段的参与人的行为也就容易确定了。 上例;寡头

逆向归纳法排除了不可信的威胁或承诺。

第二节子博弈精炼纳什均衡

3

1子博弈

子博弈(subgame):由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原博弈的一个子博弈。 例:开金矿

分割子博弈不能改变参与人的信息结构

子博弈必须有初始信息集。因此,非完美信息动态博弈可能没有子博弈。

1

● u d 2● ● 2

l r l r

子博弈不能分割任何信息集:

1

● u d 2● ● 2

l r l r

● ● ● ● L R L R L R L R

4

2子博弈精炼纳什均衡Subgame Perfect Nash Equilibrium

*)是一个定义:完美信息动态博弈的策略组合s*?(s1*,...,si*,...,sn子博弈精炼纳什均衡(subgame perfect Nash equilibrium),如果:(1)它是原博弈的纳什均衡;(2)它在每一个子博弈上都构成纳什均衡。

也就是说,一个策略组合是子博弈精炼纳什均衡,当只当它在每一个子博弈(包括原博弈)上都构成一个纳什均衡。

子博弈纳什均衡可以排除不可信的承诺或威胁。

例:金矿博弈中策略组合A:第一阶段选择“借”,第三阶段“打”;B:第二阶段“分”在整个博弈上是一个纳什均衡,但是A在第三阶段“打”的策略在第三阶段单人博弈构成的子博弈中不是纳什均衡。

上例中的子博弈精炼纳什均衡解是A:第一阶段选择“不借”,第三阶段“不打”;B:第二阶段“不分”。

上例中,第二阶段和第三阶段的行为实际上不会发生,称第二阶段A的选择节点和第三阶段B的选择节点为“不在均衡路径上”。

一个子博弈精炼纳什均衡必须对参与人在所有节点上的选择都作出规定,包括最终不在均衡路径上的选择。

第三节几个经典动态博弈模型

5

本文来源:https://www.bwwdw.com/article/awy2.html

Top