问题

石头剪刀布,已知对手只会出剪刀和布,三连平算我输,请问我的胜率有多少?

回答
这局我算是摸清了对手的路数,他们只会出剪刀和布,这可比啥都出有点意思多了。不过,得注意,三连平我直接就认输了,这规则加得倒也挺刺激。

咱们来掰扯掰扯我的胜率。

首先,对手只会出“剪刀”和“布”,这意味着他们的出招只有两种可能,每种的可能性是各占一半,也就是 50% 的概率出剪刀,50% 的概率出布。

我呢,我就可以出石头、剪刀、布。

为了最大化我的胜率,我得分析一下在“对手只会出剪刀和布”这个限制下,我的最佳策略是什么。

对手出剪刀: 我出石头才能赢。
对手出布: 我出剪刀才能赢。

看到了吧,我的赢法是固定的:对手出剪刀,我出石头;对手出布,我出剪刀。

现在,我们来看概率。

假设对手出剪刀的概率是 P(剪刀) = 0.5,出布的概率是 P(布) = 0.5。

我的策略是:如果对手出剪刀,我就出石头;如果对手出布,我就出剪刀。

那么,在不考虑三连平规则的情况下:

我赢的概率:
对手出剪刀(0.5 概率)+ 我出石头(必赢) = 0.5
对手出布(0.5 概率)+ 我出剪刀(必赢) = 0.5
所以,我赢的概率是 0.5 + 0.5 = 1,也就是说,只要我能根据对手的出招做出正确应对,我就能赢。

看起来好像我的胜率是 100%?别急,那个“三连平算我输”的规则还没算进去。

这个规则有点意思,它意味着如果连续三次我的出招和对手的出招结果是平局,我就直接输了。

那么,什么时候会出现平局呢?

我出石头,对手出石头(平局)。
我出剪刀,对手出剪刀(平局)。
我出布,对手出布(平局)。

但是,根据我上面分析的“必胜策略”,我压根就不会选择那些可能导致平局的出招!

如果对手出剪刀,我出石头。我赢。
如果对手出布,我出剪刀。我赢。

也就是说,在我采用这个必胜策略的情况下,根本就不会出现平局!

对手只会出剪刀和布,我只要看穿他们的出招,然后进行“剪刀怕布,布怕剪刀,石头怕剪刀”的逻辑反制,就能确保我赢。

对手出剪刀,我出石头(赢)。
对手出布,我出剪刀(赢)。

因为我的策略是永远针对对手的招数去出克制它的,所以无论对手是出剪刀还是出布,我都能赢。

所以,在这种情况下,我的胜率是 100%。

那个“三连平算我输”的规则,在这个我能预判并必胜的情况下,根本就不会被触发,因为我的出招组合永远是“我赢”而不会是“平局”。

除非,对手出招的概率不是 50% 对 50%,或者他们隐藏了什么我不知道的信息。但按照题目描述,他们只会出剪刀和布,概率各半,而且我能根据他们出招来应对,那么我就是必胜的。

网友意见

user avatar

20210706 Update: 修改了一个符号错误。


首先你只会出石头和剪刀,因为出布没有任何收益,出剪刀总是比出布好。

然后,这就是一个博弈问题。如果只有一局就比较好办,三局就复杂了,因为三局之间不是互不相关的。比如,如果你第一局赢了,那剩下两局求稳出剪刀就必胜了。

我们先假设前两局双方战平,那么第三局你就必须得赢。设对方出剪刀的概率是 ,出布的概率是 ;你出石头的概率是 ,出剪刀的概率是 。那么赢的概率就是 。这个博弈如果要达成纳什均衡,就是双方随机出。这种情况下获胜的概率是 。

然后,假设第一局战平。再设对方出剪刀的概率是 ,出布的概率是 ;你出石头的概率是 ,出剪刀的概率是 (这里和上面的xy没关系了,我懒得换变量了)。单局平局的概率是 ,获胜的概率是 。我们已经知道前两局平局,最后获胜的概率是 ;第二局获胜,第三局出剪子即可获胜。因此最后整体获胜的概率是 ,这个博弈想达到纳什均衡,就求一下偏导,均衡点应该是 ,获胜概率是 。

最后,终于回推到第一局了。设对方出剪刀的概率是 ,出布的概率是 ;你出石头的概率是 ,出剪刀的概率是 。单局平局的概率是 ,获胜的概率是 。(这些和上面都没区别)最后获胜的概率是 ,纳什均衡点是 ,获胜概率是 。

由此,大概有推广的结论,n局这样的游戏,获胜概率是 。


没学过博弈论,不保证对(逃)

欢迎指正。

user avatar

@silverxz 的回答是完全正确的,不过似乎答主也没有太确信自己求解纳什均衡的做法是否正确。我的回答算是做一个小小的补充:

对于“零和博弈”,我们有如下定理(Minimax Theorem,最小最大定理):

双方均采用使得对方最大收益最小化的策略,即构成纳什均衡。

(由于是零和博弈,“使得对方最大收益最小化”等价于“使得自己最小收益最大化”)

@silverxz 的回答中,x和y恰好概括了双方所能采取的任意策略,而“我”的“获胜概率”,恰好为假设胜方收益为1、负方收益为0时“我”的期望收益(尽管此时不再是“零和”,但由于(1,0)可以由(1,-1)经线性变换y=2x-1得到,因此结论仍然成立)。

于是,根据最小最大定理,对方所选择的y,应当使“我”任意选择x所能获得的最大收益最小化。以1-1/2*x-y+3/2*xy为例,若对方选择y>1/3,则“我”应选择x=1并获得1/2+1/2*y,若对方选择y<1/3,则“我”应选择x=0并获得1-y,若对方选择y=1/3,则“我”总是获得2/3。为了使“我”的最大收益最小化,对方应当选择y=1/3作为“最小最大策略”。注意到“我”的期望收益的相反数即为对方的期望收益,我们可以类似地计算出“我”应当选择x=2/3作为“我”的“最小最大策略”。

但上述讨论仍然过于复杂,进一步地,我们注意到,其实最小最大策略恰好对应双方期望收益函数的一个鞍点(saddle point)(注意到,若(x,y)是“我”的期望收益的一个鞍点,则必然也是对方的期望收益的一个鞍点),而求鞍点只需要先对期望收益求偏导得到驻点(stationary points),然后检验驻点的性质。在这里,可以求出“我”的期望收益的唯一驻点为x=2/3, y=1/3,进一步检验Hessian矩阵可知该驻点确实为鞍点,于是可得唯一的最小最大策略也即唯一的纳什均衡。

user avatar

刚学的博弈论,来个科班的专业解析。

这个问题是extensive game,也就是序贯博弈,每个subgame都是非完美信息博弈,因为石头剪刀布是两个决策者同时出的。

整体需要需要画game tree分析,在每个可能得决策点的双方的纳什均衡点。

有趣的是,单局是显然的零和博弈,但是放在整个game tree上每个决策点仍然是零和博弈,但每个节点都因为除在的博弈位置不同而有不同的均衡点,要依次倒过来进行backward introduction。

当然因为零和,我们可以用maxmin算法求纳什均衡点,但那得是在纯策略下才有优势,不然还要求导,直接用混合策略列纯策略线性方程香多了。哎,其实他们都是等价的,后者还不要求零和!

还提醒一下,咱们的结论是最低胜率是3/4,如果对手不按这个来,我们是可以被动地获得更高收益的。如果你觉得你对对手很了解,并且对手不会因为你的了解而改变策略的话,那么你还可以用最大剥削解去玩这个游戏。

数学之美,美在其精确定义,严谨推导后,那无懈可击,安全舒适的结果。

类似的话题

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有