百科问答小站 logo
百科问答小站 font logo



石头剪刀布,已知对手只会出剪刀和布,三连平算我输,请问我的胜率有多少? 第1页

  

user avatar   silverxz 网友的相关建议: 
      

20210706 Update: 修改了一个符号错误。


首先你只会出石头和剪刀,因为出布没有任何收益,出剪刀总是比出布好。

然后,这就是一个博弈问题。如果只有一局就比较好办,三局就复杂了,因为三局之间不是互不相关的。比如,如果你第一局赢了,那剩下两局求稳出剪刀就必胜了。

我们先假设前两局双方战平,那么第三局你就必须得赢。设对方出剪刀的概率是 ,出布的概率是 ;你出石头的概率是 ,出剪刀的概率是 。那么赢的概率就是 。这个博弈如果要达成纳什均衡,就是双方随机出。这种情况下获胜的概率是 。

然后,假设第一局战平。再设对方出剪刀的概率是 ,出布的概率是 ;你出石头的概率是 ,出剪刀的概率是 (这里和上面的xy没关系了,我懒得换变量了)。单局平局的概率是 ,获胜的概率是 。我们已经知道前两局平局,最后获胜的概率是 ;第二局获胜,第三局出剪子即可获胜。因此最后整体获胜的概率是 ,这个博弈想达到纳什均衡,就求一下偏导,均衡点应该是 ,获胜概率是 。

最后,终于回推到第一局了。设对方出剪刀的概率是 ,出布的概率是 ;你出石头的概率是 ,出剪刀的概率是 。单局平局的概率是 ,获胜的概率是 。(这些和上面都没区别)最后获胜的概率是 ,纳什均衡点是 ,获胜概率是 。

由此,大概有推广的结论,n局这样的游戏,获胜概率是 。


没学过博弈论,不保证对(逃)

欢迎指正。


user avatar   richard-xu-25 网友的相关建议: 
      

@silverxz 的回答是完全正确的,不过似乎答主也没有太确信自己求解纳什均衡的做法是否正确。我的回答算是做一个小小的补充:

对于“零和博弈”,我们有如下定理(Minimax Theorem,最小最大定理):

双方均采用使得对方最大收益最小化的策略,即构成纳什均衡。

(由于是零和博弈,“使得对方最大收益最小化”等价于“使得自己最小收益最大化”)

@silverxz 的回答中,x和y恰好概括了双方所能采取的任意策略,而“我”的“获胜概率”,恰好为假设胜方收益为1、负方收益为0时“我”的期望收益(尽管此时不再是“零和”,但由于(1,0)可以由(1,-1)经线性变换y=2x-1得到,因此结论仍然成立)。

于是,根据最小最大定理,对方所选择的y,应当使“我”任意选择x所能获得的最大收益最小化。以1-1/2*x-y+3/2*xy为例,若对方选择y>1/3,则“我”应选择x=1并获得1/2+1/2*y,若对方选择y<1/3,则“我”应选择x=0并获得1-y,若对方选择y=1/3,则“我”总是获得2/3。为了使“我”的最大收益最小化,对方应当选择y=1/3作为“最小最大策略”。注意到“我”的期望收益的相反数即为对方的期望收益,我们可以类似地计算出“我”应当选择x=2/3作为“我”的“最小最大策略”。

但上述讨论仍然过于复杂,进一步地,我们注意到,其实最小最大策略恰好对应双方期望收益函数的一个鞍点(saddle point)(注意到,若(x,y)是“我”的期望收益的一个鞍点,则必然也是对方的期望收益的一个鞍点),而求鞍点只需要先对期望收益求偏导得到驻点(stationary points),然后检验驻点的性质。在这里,可以求出“我”的期望收益的唯一驻点为x=2/3, y=1/3,进一步检验Hessian矩阵可知该驻点确实为鞍点,于是可得唯一的最小最大策略也即唯一的纳什均衡。


user avatar   magic2728 网友的相关建议: 
      

刚学的博弈论,来个科班的专业解析。

这个问题是extensive game,也就是序贯博弈,每个subgame都是非完美信息博弈,因为石头剪刀布是两个决策者同时出的。

整体需要需要画game tree分析,在每个可能得决策点的双方的纳什均衡点。

有趣的是,单局是显然的零和博弈,但是放在整个game tree上每个决策点仍然是零和博弈,但每个节点都因为除在的博弈位置不同而有不同的均衡点,要依次倒过来进行backward introduction。

当然因为零和,我们可以用maxmin算法求纳什均衡点,但那得是在纯策略下才有优势,不然还要求导,直接用混合策略列纯策略线性方程香多了。哎,其实他们都是等价的,后者还不要求零和!

还提醒一下,咱们的结论是最低胜率是3/4,如果对手不按这个来,我们是可以被动地获得更高收益的。如果你觉得你对对手很了解,并且对手不会因为你的了解而改变策略的话,那么你还可以用最大剥削解去玩这个游戏。

数学之美,美在其精确定义,严谨推导后,那无懈可击,安全舒适的结果。




  

相关话题

  你认为在影响经济发展的各种因素中,有哪些因素是不能用数学的方法,来进行定量的描述和衡量呢? 
  高一新生看欧几里得的几何原本好还是希尔伯特的几何基础好? 
  为什么说高斯公式是斯托克斯公式的特例? 
  数学专业学生,认真听讲、推导书上公式,但不做题,会出现什么问题? 
  对于一维空间和二维空间以及多维度空间应该如何理解? 
  数理金融和金融工程需要修的数学课程有哪些? 
  可测集多还是不可测集多? 即一维,直到n维的欧氏空间中,可测集类和不可测集类是否等势? 
  为什么祖冲之的355/113等于3.1415929而不是3.1415926? 
  参加 2021 年丘成桐大学生数学竞赛是什么体验?如何评价今年的竞赛? 
  如何看待清华大学数学新领军计划和丘班综合测试? 

前一个讨论
奔驰分别有哪些车系?历代都包括哪些车型?
下一个讨论
全新奔驰 E300L 和宝马 530Li 选哪个更好?





© 2024-05-05 - tinynew.org. All Rights Reserved.
© 2024-05-05 - tinynew.org. 保留所有权利