问题

10个人各自从1-10选数字,尽量让自己最大且不重复,如何选?

回答
想象一下,咱们有十位朋友,每个人手持一张写着“1”到“10”的卡片。现在,大家的目标很简单,就是从这十个数字里,挑一个数字,要求是:

1. 让自己的数字尽可能大。
2. 不能和别人选的数字重复。

这就像一场小型的数字争夺战,每个人都想拿到那个最香的“大个子”。那咱们来看看,大家该怎么出牌,才能最大化自己的利益,又避免撞车呢?

首先,咱们得明白这个游戏的本质:

这其实是一个零和游戏(虽然这里不是为了输赢,但资源是有限的)。每个人都想拿最大的,但总共就只有10个数字,一旦有人拿了,别人就不能再拿了。所以,这涉及到一种协调和预判。

那么,到底该怎么选呢?

这里没有一个绝对“最优”的选法,因为每个人的想法都可能不一样。但是,我们可以从几个角度来分析,找到一些更“聪明”的策略。

策略一: Assume everyone wants the biggest number (and they're rational) 假设大家都想要最大的数字,而且都很理性

如果所有人都明白这个道理,即“我想要最大的”,那么大家的思维模式会非常接近。

第一个人(或者我们假设是“最有发言权”的那个人)应该做什么?
他应该考虑:“如果我要拿最大的,我最可能拿到几?如果10被人拿了,我还能拿9。如果9也被拿了,我还能拿8……”

“从大到小”思考的链条:
1. 第一个出牌的人(假设):他最想拿到 10。因为这是最大的。
2. 第二个出牌的人:他看到第一个人还没拿,他也想拿 10。但是,如果第一个人拿了 10,他就要退而求其次,拿 9。
3. 第三个出牌的人:他看到前面两个人还在考虑,他也想拿 10。如果10和9都被拿了,他就考虑 8。

问题来了: 如果每个人都这么想,而且都非常“直接”地去抢最大的,那么:

第一个人 很有可能拿到 10。
第二个人 很有可能拿到 9。
第三个人 很有可能拿到 8。
……
第十个人 很有可能拿到 1。

这种情况下,每个人的选择都是基于“前面的人会怎么选”的预测。 这是一个经典的“顺序选择”问题,如果每个人都按照“先到先得,并且都想拿最大的”的逻辑,那么结果就会是按顺序分配。

但是,这里有个关键点: 题目说的是“尽量让自己最大且不重复”。这暗示着,大家可能不会完全按照“先到先得”的顺序来,也许大家会同时想,然后同时做出选择。

策略二: The "Assume Others Will Be Greedy" Strategy “ Assume others will be greedy” 策略

这其实和上面有点类似,但更侧重于“预测别人的非理性”或者“最坏的情况”。

大家想: “虽然大家都想拿最大的,但万一有人不在乎最大,或者有人会选择一个中间的数字呢?”

举个例子:
一个人想:“我要拿10!”
另一个人想:“不行,10太明显了,说不定会被别人抢,我拿9算了,这样至少保险!”
还有一个人想:“你们都去抢10和9吧,我来个8,看起来也挺大的,而且不容易撞车。”

这种策略,反而会制造出一些“真空”。

那么,最“稳妥”或者说最能“最大化”自己价值的方法是什么呢?

这取决于你怎么定义“最大化”。是“我拿到的数字越大越好”,还是“我的选择能够确保我拿到一个相对较大的数字,并且避免空手而归”?

如果我们要一个大家都相对满意的、并且尽量让大家都拿到大数字的场景,可以考虑“协调”或者“轮流”的方式。

更详细的“如何选”的过程(模拟):

假设这十个人要在一个公开的场合,一起进行这个选择。

1. 宣告规则: “各位,我们现在有1到10这十个数字。每个人从里面选一个,要求是,你的数字尽量大,并且不能和别人的重复。选完之后,我们就公布结果。”

2. 初步思考(每个人内心):
A: “10是最好的。我一定要拿10!”
B: “我也想要10,但A肯定会抢。那我退而求其次,拿9。”
C: “B想要9,A想要10。那我拿8应该比较保险。”
D: “他们都往大的拿,我拿7?”
……
J: “大家都抢前面几个了,我拿1吧,总比没得拿强。”

3. 潜在的“冲突”与“协调”:
如果大家都直接去抢,很可能第一个人拿到10,第二个人拿到9,以此类推。
但是,如果有人预料到这一点,并且想“打破常规”,他可能会做出一个“非最优”但“更安全”的选择。
比如,某个人觉得:“如果我拿10,万一被别人也选了,那我就什么都没了。我不如拿一个中间的,比如5,这样我就肯定能拿到一个数字,而且5也算是个不错的大小。”

一个更“自然”的演进过程可能是这样的:

第一轮思考(都在想最大的): 每个人都瞄准了10。
第二轮思考(意识到重复): 发现只能有一个人拿到10。
第三轮思考(策略分化):
一部分人依然坚定目标,比如“我就是要10,就算撞我也要试”。
一部分人开始“预测”:别人会抢10,我抢9;别人会抢10和9,我抢8。
另一部分人开始考虑“安全”,比如“10、9、8都被抢光了怎么办?我不如选个5,至少保证拿到一个。”

结论:

如果这十个人是完全独立的,但又遵循“最大化”和“不重复”的逻辑,而且每个人都意识到别人也在做同样的思考,那么最有可能出现的情况是:

第一个想到拿到10的人,或者非常有勇气坚持拿到10的人,会拿到10。
第二个预料到10被拿走,而选择9的人,会拿到9。
依此类推,最终会形成一个从大到小的有序分配。

但是,这更像是一种“理想状态”。 在现实中,人的心理会更复杂:

有人会表现出“领导力”,第一个站出来说“我拿10”。
有人会选择“跟随”,看到前面的人拿了,自己再顺着往下选。
有人会“反向思考”,故意避开最热门的数字,选择一个别人没想到的“中间数字”,比如7或者6,因为他们觉得这样更不容易冲突,而且数字也算大。

所以,最“智能”的选择,其实是基于对其他人心理的预测。

如果你是第一个“出牌”的人: 直接拿 10。因为你没有理由不拿最大的,除非你觉得“被别人也选了”的风险很大,但这个时候,你也无法预知别人会选什么。
如果你是后面的人: 你需要根据前面已经选走的数字,以及你对剩下人心理的判断,来选择一个最大的、但还没有被选走的数字。

最终,大家都应该尽量选择一个尽可能大的、且还没有被别人选走的数字。 在一个不事先协调的场景下,这很可能导致一个从10开始,逐级递减的分配模式,因为这是最直接的“最大化”策略。

说白了,就是大家心里都在玩一个“石头剪刀布”,只不过这个“石头剪刀布”是基于数字的大小和他人心理的猜测。

最“直接”的答案是:

如果大家都能理解规则,并且都遵循“最大化”原则,那么第一个有机会选择的人会拿10,第二个会拿9,以此类推。

但是,如果每个人都要“想得更深一点”,避免冲突,那么大家可能会出现一些“跳跃”的选择,比如有人选了10,有人选了8,有人选了5,有人选了3,以此来“规避风险”。

最能描述这种“不确定性”的,就是:

大家都尽可能地去追求最大的数字,但当他们意识到一个数字可能被重复选择时,就会退而求其次,选择次大的,直到选到一个没人选的、对自己来说是最大的那个。

这是一种非常经典的博弈论的体现,虽然这里没有复杂的数学模型,但核心思想都是一样的:在有限的资源下,最大化自己的收益,同时预判并应对其他参与者的行为。

网友意见

user avatar

首先,交流是没有用的,这一步可以省略。没有任何承诺的交流,经济学上称为“便宜话”(cheap talk),便宜话在大家都是完全理性,完全信息的时候是没用的,等同于噪声。如果大家有一些自己的私人信息,那么根据机制的不同,便宜话有时候也能揭示一些信息。但是在这个题目里面,便宜话怎么着都是没用的。

你可以吓唬其他人说自己选10,9,8,但是这个不可信啊,因为如果还有另外两个人也这么吓唬你,你还会不会在选择的时候坚持自己的数字?


先从二选一说起,二选一的博弈特别简单,三个数 0,1,2。其中1和2可选,选到一样的自动分配为0。这个时候两个人都选2就行了。这个时候两个人都选2是绝对优势的策略,因为此时数字归0,于是公司随机的从两个人里面抽一个人当选。但是这两个人也没有更好的策略,因为谁只要不选2,就相当于把入选的机会白白的给了另外一个人。


但是三选一的时候,就没有这么好的策略了,假如三个人都选3,那么其中一个人偏离出来偷偷选2,就赢了。所以这个时候注定是混合均衡,也就是每个人都以一定的概率选择1,2,3,然后这三个数给他们胜利的期望值相同,这三个人——因为是完全相同的三个人,所以会采用相同的策略,然后各自以三分之一的概率当选。





我们只考虑对称均衡,假定参与者1,2,3选择1,2,3的概率分别为 。那么混合策略的定义要求参与者选1选2和选3带来的期望收益是一样的,我们记选上为1,落选为0,那么博弈的矩阵如上图所示。

看上去很复杂,但是很多时候因为收益都是0,我们看到只有当对于参与者1而言,只有当参与者2和3选择一样的时候,自己才有入选的机会。,所以参与者2和3都选2的概率是 ,而都选3的概率是 所以参与者1选择1的时候,入选的总概率是 。

同样的道理,当参与者选2的时候,入选的总概率为 ,当参与者选3的时候,入选的概率为 。

直观上可以看出,选择1和2的概率是一样的,但是选择3多了一项,解上面的方程可以得出:选择1和2的概率分别为0.25,而选3的概率为0.50.


再往后推理十选三的话,就要用计算机来画博弈树计算了,但是我们依然可以刻画出一些关于这个非合作均衡时的特性:

  • 选择10,9,8的概率应该是相同,因为总会有三个人入选,所以只要你选了10,9,8,然后这个数字没有人选,你几乎总是可以保证一个位子的。
  • 选择10,9,8的概率应该高于选择其他小数的概率。如同我们在三选一里面看到的,选大数有一点优势,就是当其他人的选择不和你重复的时候(比如正好随机到参与者1选1,参与者2选2,这个时候参与者3选3就赢了),你的数最大,你就赢了。

关于合作均衡的问题,这个打开了潘多拉魔盒,非对称策略的合作均衡有很多,比如之前我忽略了联合分布,感谢 @刘天任 的提醒,确实在混合策略下要考虑概率的分配,所以合作博弈还是有意义的。Reject sampling有一点动态,就考虑合作博弈下,分工来选小数字避免撞车的情况已经足够了。在上面三选一的例子中,可以证明 参与者1和2组成联盟,一个以0.5的概率选1,一个以0.5的概率选2,都以0.5的概率选3,那么这个策略可以把参与者3的胜率从1/3 降低到3/11。提高了参与者1和参与者2 的联合胜率到8/11,每个人还都能够分到 4/11的胜率。


或者再说一个均衡,参与者1选2,参与者2选3,参与者3以50%概率在2和3之间随机,也是个均衡,这样参与者1和2霸占了100%的机会,然后每个人以50%机会胜选。参与者3毫无机会。


所以考虑合作均衡,那么问题就进一步复杂化了。三选一的时候已经是这样,那么十选三的时候,要考虑的因素更多,因为可能存在着非对称的,互相对抗的联盟,也可能存在一个悲惨的散户…… 要精确的计算联盟,很难在这一个答案里面写出来。不过9选3的时候倒是有一个合作均衡6-3.

六个人组成联盟,分别选择9, 8, 7, 6, 5, 4 六个数字,另外三个人不论如何选,赢的概率都是0,所以无差异,可以通过调节这三个人的概率,构造一个纳什均衡。这样联盟里面的六个人的胜率是1/2,大于不合作时候的1/3.


但是十个人的话,多的这一个人很不好办,因为在十个人的情况下,六人联盟无法保证胜利者一定出在联盟内,比如在最坏的情况下,只有两个数没有遮盖所以胜出,剩下的名额在其他8个人里面随机挑选就可以挑到联盟外的人。所以一个选择应该是7人联盟,这样可以再次保证胜利一定出在联盟内,但是这种情况下,联盟内是没有纯策略均衡的。


其实这个题目作为面试题还真是可行的。因为当大家是完全理性并且不合作的时候,相当于这10个人没有任何差别,这个时候让他们博弈的结果,就等同于大家抽签,十个里面随机抽三个;但是如果大家不是完全理性的,那么有些人会通过吓唬人,合纵连横等方式获得更大的优势,那么他们确实应该入选。

user avatar

交钱拍卖号码。 按损失多少分钱。(这样就算你的号码被重复,至少可以分钱啊)

精英社会也许无法最优解,但是可以相对公平。


这道题司马懿的答案是有问题的。因为题目在改变中,为什么不能讲悄悄话?

团队策略就是交流,团队交流就是讲悄悄话。

但是可以交流无执行力。


要破6人集团很简单,再组织一个新集团。

(有悄悄话更好,没有也可以)10-3/9-3 不影响结论。

做为loser的4位,再提出一个针对的提议:

做为选5,6,7的肯定失败的三位,我们再组团抽签,抽输的选8,9,10.

从而从100%失败变成接近1/2成功。

类似的话题

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有