玩家1选U的期望收益:$q imes 1 + (1q) imes 0 = q$ 玩家1选X的期望收益:$q imes 2 + (1q) imes 0 = 2q$
玩家1选D的期望收益:$q imes 0 + (1q) imes 0 = 0$
令 $q = 0$。 这说明,只有当玩家2完全不选L(即玩家2总是选R)时,玩家1才会愿意混合(或者说,如果玩家2总选R,玩家1无论选U还是D收益都是0)。但是,如果玩家2总选R,玩家1选择U和D的收益都是0,这并不构成严格的混合。
玩家2为了混合 ($0 玩家2选L的期望收益:$p imes 1 + (1p) imes 0 = p$
玩家2选R的期望收益:$p imes 0 + (1p) imes 0 = 0$
令 $p = 0$。 这说明,只有当玩家1完全不选U(即玩家1总是选D)时,玩家2才会愿意混合(或者说,如果玩家1总选D,玩家2无论选L还是R收益都是0)。
这个例子,似乎也推导不出有意义的混合策略纳什均衡。
我们再回到“石头剪刀布”这个最典型的例子。
| | 玩家2:石头 (S) | 玩家2:剪刀 (P) | 玩家2:布 (R) |
| : | : | : | : |
| 玩家1:石头 (S) | (0, 0) | (1, 1) | (1, 1) |
| 玩家1:剪刀 (P) | (1, 1) | (0, 0) | (1, 1) |
| 玩家1:布 (R) | (1, 1) | (1, 1) | (0, 0) |
纯策略分析:
对于玩家1,如果玩家2出石头,他出剪刀最好。
如果玩家2出剪刀,他出布最好。
如果玩家2出布,他出石头最好。
没有玩家能单方面改变策略来获得更好的收益,因为对方总能找到一个反制策略。因此,石头剪刀布没有纯策略纳什均衡。
混合策略分析:
如果玩家1以 $(1/3, 1/3, 1/3)$ 的概率混合S, P, R。
那么玩家2选择S的期望收益是 $(1/3) imes 0 + (1/3) imes 1 + (1/3) imes (1) = 0$。
玩家2选择P的期望收益是 $(1/3) imes (1) + (1/3) imes 0 + (1/3) imes 1 = 0$。
玩家2选择R的期望收益是 $(1/3) imes 1 + (1/3) imes (1) + (1/3) imes 0 = 0$。
所有策略的期望收益都为0。这正是混合策略纳什均衡的体现!
所以,石头剪刀布有唯一的混合策略纳什均衡,但没有纯策略纳什均衡。
好了,现在我们绕回来的目标: 存在唯一纯策略纳什均衡,但不等于不存在混合策略纳什均衡。
这种情况是可能存在的,而且很多博弈都如此。
关键点在于:
纳什均衡的完备性: 任何有限博弈(策略有限、收益有限)都至少存在一个纳什均衡(可能是纯策略的,也可能是混合策略的)。
纯策略均衡的“脆弱性”: 即使存在一个纯策略纳什均衡,它也可能不是“鲁棒”的。也就是说,如果稍微改变一下其他玩家的策略(哪怕只是一点点概率上的变动),这个纯策略均衡就可能不再是均衡了。
混合策略的“保险”作用: 玩家通过混合策略,可以“混淆”对手的判断,使得对手无法找到一个最优的纯策略来针对自己。当一个纯策略纳什均衡不是由优势策略构成时,玩家就有可能通过混合来“稳定”局面。
我们回到前面“匹配支付”那个例子,稍作修改,看看能不能构造一个唯一纯策略纳什均衡,但也有混合策略均衡的。
| | 玩家2:策略L | 玩家2:策略R |
| : | : | : |
| 玩家1:策略U | (3, 1) | (0, 0) |
| 玩家1:策略D | (0, 0) | (1, 3) |
纯策略分析:
如果玩家2选L:玩家1选U(得3)比D(得0)好。
如果玩家2选R:玩家1选D(得1)比U(得0)好。
如果玩家1选U:玩家2选L(得1)比R(得0)好。
如果玩家1选D:玩家2选R(得3)比L(得0)好。
(U, L) 和 (D, R) 都是纯策略纳什均衡。 这个还是有多个纯策略均衡。
要构造一个“唯一纯策略纳什均衡,同时存在混合策略纳什均衡”的博弈,通常需要“非对称性”和“弱优势策略”。
比如,考虑这样一个博弈(改编自一些经济学模型):
| | 玩家2:策略A | 玩家2:策略B |
| : | : | : |
| 玩家1:策略X | (2, 1) | (0, 0) |
| 玩家1:策略Y | (0, 0) | (1, 2) |
纯策略分析:
如果玩家2选A:玩家1选X(得2)比Y(得0)好。
如果玩家2选B:玩家1选Y(得1)比X(得0)好。
如果玩家1选X:玩家2选A(得1)比B(得0)好。
如果玩家1选Y:玩家2选B(得2)比A(得0)好。
(X, A) 是一个纯策略纳什均衡。
现在,我们来看看是否存在混合策略纳什均衡。
假设玩家1以概率 $p$ 选X, $1p$ 选Y。
假设玩家2以概率 $q$ 选A, $1q$ 选B。
玩家1为了混合 ($0
玩家1选Y的期望收益:$q imes 0 + (1q) imes 1 = 1q$
令 $2q = 1q implies 3q = 1 implies q = 1/3$。
所以,当玩家2以 $1/3$ 的概率选A, $2/3$ 的概率选B时,玩家1会愿意混合。
玩家2为了混合 ($0 玩家2选A的期望收益:$p imes 1 + (1p) imes 0 = p$
玩家2选B的期望收益:$p imes 0 + (1p) imes 2 = 2(1p)$
令 $p = 2(1p) implies p = 2 2p implies 3p = 2 implies p = 2/3$。
所以,当玩家1以 $2/3$ 的概率选X, $1/3$ 的概率选Y时,玩家2会愿意混合。
因此,存在一个混合策略纳什均衡:玩家1以 $(2/3, 1/3)$ 的概率混合,玩家2以 $(1/3, 2/3)$ 的概率混合。
在这个例子中,我们确实找到了一个唯一的纯策略纳什均衡 (X, A),同时又存在一个混合策略纳什均衡。
总结一下:
纳什均衡存在的“基石”: 任何有限博弈都至少有一次纳什均衡。
纯策略均衡的“排他性”: 所谓的“唯一纯策略纳什均衡”是指,在所有可能的纯策略组合中,只有那一个组合满足纳什均衡的条件。
混合策略的“补充性”: 混合策略的出现,并不依赖于纯策略均衡的“不存在”。它关注的是玩家如何通过概率来使对手难以预测,从而获得相对稳定的收益。
关键的区别在于“优势策略”: 如果唯一的纯策略纳什均衡是由每个玩家的“优势策略”构成的(如囚徒困境),那么因为优势策略的存在,玩家没有动机去混合,所以不存在混合策略纳什均衡。
但是,如果唯一的纯策略纳什均衡,不是由优势策略(或者在经过占优策略消除法之后唯一剩下的策略)构成的,那么玩家仍然有可能通过引入概率来寻找一种“无差异”的混合策略,从而构成另一个(或多个)混合策略纳什均衡。
所以,“唯一纯策略纳什均衡”和“不存在混合策略纳什均衡”这两件事,从来都不是必然联系在一起的。 很多情况下,它们是并存的。
希望我这样解释,能让你更清晰地理解这其中的逻辑。这博弈论的魅力就在于,看似简单的规则下,隐藏着如此丰富的可能性。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有