10个人各自从1-10选数字，尽量让自己最大且不重复，如何选？

想象一下，咱们有十位朋友，每个人手持一张写着“1”到“10”的卡片。现在，大家的目标很简单，就是从这十个数字里，挑一个数字，要求是：

1. 让自己的数字尽可能大。
2. 不能和别人选的数字重复。

这就像一场小型的数字争夺战，每个人都想拿到那个最香的“大个子”。那咱们来看看，大家该怎么出牌，才能最大化自己的利益，又避免撞车呢？

首先，咱们得明白这个游戏的本质：

这其实是一个零和游戏（虽然这里不是为了输赢，但资源是有限的）。每个人都想拿最大的，但总共就只有10个数字，一旦有人拿了，别人就不能再拿了。所以，这涉及到一种协调和预判。

那么，到底该怎么选呢？

这里没有一个绝对“最优”的选法，因为每个人的想法都可能不一样。但是，我们可以从几个角度来分析，找到一些更“聪明”的策略。

策略一： Assume everyone wants the biggest number (and they're rational) 假设大家都想要最大的数字，而且都很理性

如果所有人都明白这个道理，即“我想要最大的”，那么大家的思维模式会非常接近。

第一个人（或者我们假设是“最有发言权”的那个人）应该做什么？
他应该考虑：“如果我要拿最大的，我最可能拿到几？如果10被人拿了，我还能拿9。如果9也被拿了，我还能拿8……”

“从大到小”思考的链条：
1. 第一个出牌的人（假设）：他最想拿到 10。因为这是最大的。
2. 第二个出牌的人：他看到第一个人还没拿，他也想拿 10。但是，如果第一个人拿了 10，他就要退而求其次，拿 9。
3. 第三个出牌的人：他看到前面两个人还在考虑，他也想拿 10。如果10和9都被拿了，他就考虑 8。

问题来了：如果每个人都这么想，而且都非常“直接”地去抢最大的，那么：

第一个人很有可能拿到 10。
第二个人很有可能拿到 9。
第三个人很有可能拿到 8。
……
第十个人很有可能拿到 1。

这种情况下，每个人的选择都是基于“前面的人会怎么选”的预测。这是一个经典的“顺序选择”问题，如果每个人都按照“先到先得，并且都想拿最大的”的逻辑，那么结果就会是按顺序分配。

但是，这里有个关键点：题目说的是“尽量让自己最大且不重复”。这暗示着，大家可能不会完全按照“先到先得”的顺序来，也许大家会同时想，然后同时做出选择。

策略二： The "Assume Others Will Be Greedy" Strategy “ Assume others will be greedy” 策略

这其实和上面有点类似，但更侧重于“预测别人的非理性”或者“最坏的情况”。

大家想： “虽然大家都想拿最大的，但万一有人不在乎最大，或者有人会选择一个中间的数字呢？”

举个例子：
一个人想：“我要拿10！”
另一个人想：“不行，10太明显了，说不定会被别人抢，我拿9算了，这样至少保险！”
还有一个人想：“你们都去抢10和9吧，我来个8，看起来也挺大的，而且不容易撞车。”

这种策略，反而会制造出一些“真空”。

那么，最“稳妥”或者说最能“最大化”自己价值的方法是什么呢？

这取决于你怎么定义“最大化”。是“我拿到的数字越大越好”，还是“我的选择能够确保我拿到一个相对较大的数字，并且避免空手而归”？

如果我们要一个大家都相对满意的、并且尽量让大家都拿到大数字的场景，可以考虑“协调”或者“轮流”的方式。

更详细的“如何选”的过程（模拟）：

假设这十个人要在一个公开的场合，一起进行这个选择。

1. 宣告规则： “各位，我们现在有1到10这十个数字。每个人从里面选一个，要求是，你的数字尽量大，并且不能和别人的重复。选完之后，我们就公布结果。”

2. 初步思考（每个人内心）：
A： “10是最好的。我一定要拿10！”
B： “我也想要10，但A肯定会抢。那我退而求其次，拿9。”
C： “B想要9，A想要10。那我拿8应该比较保险。”
D： “他们都往大的拿，我拿7？”
……
J： “大家都抢前面几个了，我拿1吧，总比没得拿强。”

3. 潜在的“冲突”与“协调”：
如果大家都直接去抢，很可能第一个人拿到10，第二个人拿到9，以此类推。
但是，如果有人预料到这一点，并且想“打破常规”，他可能会做出一个“非最优”但“更安全”的选择。
比如，某个人觉得：“如果我拿10，万一被别人也选了，那我就什么都没了。我不如拿一个中间的，比如5，这样我就肯定能拿到一个数字，而且5也算是个不错的大小。”

一个更“自然”的演进过程可能是这样的：

第一轮思考（都在想最大的）：每个人都瞄准了10。
第二轮思考（意识到重复）：发现只能有一个人拿到10。
第三轮思考（策略分化）：
一部分人依然坚定目标，比如“我就是要10，就算撞我也要试”。
一部分人开始“预测”：别人会抢10，我抢9；别人会抢10和9，我抢8。
另一部分人开始考虑“安全”，比如“10、9、8都被抢光了怎么办？我不如选个5，至少保证拿到一个。”

结论：

如果这十个人是完全独立的，但又遵循“最大化”和“不重复”的逻辑，而且每个人都意识到别人也在做同样的思考，那么最有可能出现的情况是：

第一个想到拿到10的人，或者非常有勇气坚持拿到10的人，会拿到10。
第二个预料到10被拿走，而选择9的人，会拿到9。
依此类推，最终会形成一个从大到小的有序分配。

但是，这更像是一种“理想状态”。在现实中，人的心理会更复杂：

有人会表现出“领导力”，第一个站出来说“我拿10”。
有人会选择“跟随”，看到前面的人拿了，自己再顺着往下选。
有人会“反向思考”，故意避开最热门的数字，选择一个别人没想到的“中间数字”，比如7或者6，因为他们觉得这样更不容易冲突，而且数字也算大。

所以，最“智能”的选择，其实是基于对其他人心理的预测。

如果你是第一个“出牌”的人：直接拿 10。因为你没有理由不拿最大的，除非你觉得“被别人也选了”的风险很大，但这个时候，你也无法预知别人会选什么。
如果你是后面的人：你需要根据前面已经选走的数字，以及你对剩下人心理的判断，来选择一个最大的、但还没有被选走的数字。

最终，大家都应该尽量选择一个尽可能大的、且还没有被别人选走的数字。在一个不事先协调的场景下，这很可能导致一个从10开始，逐级递减的分配模式，因为这是最直接的“最大化”策略。

说白了，就是大家心里都在玩一个“石头剪刀布”，只不过这个“石头剪刀布”是基于数字的大小和他人心理的猜测。

最“直接”的答案是：

如果大家都能理解规则，并且都遵循“最大化”原则，那么第一个有机会选择的人会拿10，第二个会拿9，以此类推。

但是，如果每个人都要“想得更深一点”，避免冲突，那么大家可能会出现一些“跳跃”的选择，比如有人选了10，有人选了8，有人选了5，有人选了3，以此来“规避风险”。

最能描述这种“不确定性”的，就是：

大家都尽可能地去追求最大的数字，但当他们意识到一个数字可能被重复选择时，就会退而求其次，选择次大的，直到选到一个没人选的、对自己来说是最大的那个。

这是一种非常经典的博弈论的体现，虽然这里没有复杂的数学模型，但核心思想都是一样的：在有限的资源下，最大化自己的收益，同时预判并应对其他参与者的行为。

网友意见

首先，交流是没有用的，这一步可以省略。没有任何承诺的交流，经济学上称为“便宜话”（cheap talk），便宜话在大家都是完全理性，完全信息的时候是没用的，等同于噪声。如果大家有一些自己的私人信息，那么根据机制的不同，便宜话有时候也能揭示一些信息。但是在这个题目里面，便宜话怎么着都是没用的。

你可以吓唬其他人说自己选10，9，8，但是这个不可信啊，因为如果还有另外两个人也这么吓唬你，你还会不会在选择的时候坚持自己的数字？

先从二选一说起，二选一的博弈特别简单，三个数 0，1，2。其中1和2可选，选到一样的自动分配为0。这个时候两个人都选2就行了。这个时候两个人都选2是绝对优势的策略，因为此时数字归0，于是公司随机的从两个人里面抽一个人当选。但是这两个人也没有更好的策略，因为谁只要不选2，就相当于把入选的机会白白的给了另外一个人。

但是三选一的时候，就没有这么好的策略了，假如三个人都选3，那么其中一个人偏离出来偷偷选2，就赢了。所以这个时候注定是混合均衡，也就是每个人都以一定的概率选择1，2，3，然后这三个数给他们胜利的期望值相同，这三个人——因为是完全相同的三个人，所以会采用相同的策略，然后各自以三分之一的概率当选。

我们只考虑对称均衡，假定参与者1，2，3选择1，2，3的概率分别为。那么混合策略的定义要求参与者选1选2和选3带来的期望收益是一样的，我们记选上为1，落选为0，那么博弈的矩阵如上图所示。

看上去很复杂，但是很多时候因为收益都是0，我们看到只有当对于参与者1而言，只有当参与者2和3选择一样的时候，自己才有入选的机会。，所以参与者2和3都选2的概率是，而都选3的概率是所以参与者1选择1的时候，入选的总概率是。

同样的道理，当参与者选2的时候，入选的总概率为，当参与者选3的时候，入选的概率为。

直观上可以看出，选择1和2的概率是一样的，但是选择3多了一项，解上面的方程可以得出：选择1和2的概率分别为0.25，而选3的概率为0.50.

再往后推理十选三的话，就要用计算机来画博弈树计算了，但是我们依然可以刻画出一些关于这个非合作均衡时的特性：

选择10，9，8的概率应该是相同，因为总会有三个人入选，所以只要你选了10，9，8，然后这个数字没有人选，你几乎总是可以保证一个位子的。
选择10，9，8的概率应该高于选择其他小数的概率。如同我们在三选一里面看到的，选大数有一点优势，就是当其他人的选择不和你重复的时候（比如正好随机到参与者1选1，参与者2选2，这个时候参与者3选3就赢了），你的数最大，你就赢了。

关于合作均衡的问题，这个打开了潘多拉魔盒，非对称策略的合作均衡有很多，比如之前我忽略了联合分布，感谢 @刘天任的提醒，确实在混合策略下要考虑概率的分配，所以合作博弈还是有意义的。Reject sampling有一点动态，就考虑合作博弈下，分工来选小数字避免撞车的情况已经足够了。在上面三选一的例子中，可以证明参与者1和2组成联盟，一个以0.5的概率选1，一个以0.5的概率选2，都以0.5的概率选3，那么这个策略可以把参与者3的胜率从1/3 降低到3/11。提高了参与者1和参与者2 的联合胜率到8/11，每个人还都能够分到 4/11的胜率。

或者再说一个均衡，参与者1选2，参与者2选3，参与者3以50%概率在2和3之间随机，也是个均衡，这样参与者1和2霸占了100%的机会，然后每个人以50%机会胜选。参与者3毫无机会。

所以考虑合作均衡，那么问题就进一步复杂化了。三选一的时候已经是这样，那么十选三的时候，要考虑的因素更多，因为可能存在着非对称的，互相对抗的联盟，也可能存在一个悲惨的散户…… 要精确的计算联盟，很难在这一个答案里面写出来。不过9选3的时候倒是有一个合作均衡6-3.

六个人组成联盟，分别选择9, 8, 7, 6, 5, 4 六个数字，另外三个人不论如何选，赢的概率都是0，所以无差异，可以通过调节这三个人的概率，构造一个纳什均衡。这样联盟里面的六个人的胜率是1/2，大于不合作时候的1/3.

但是十个人的话，多的这一个人很不好办，因为在十个人的情况下，六人联盟无法保证胜利者一定出在联盟内，比如在最坏的情况下，只有两个数没有遮盖所以胜出，剩下的名额在其他8个人里面随机挑选就可以挑到联盟外的人。所以一个选择应该是7人联盟，这样可以再次保证胜利一定出在联盟内，但是这种情况下，联盟内是没有纯策略均衡的。

其实这个题目作为面试题还真是可行的。因为当大家是完全理性并且不合作的时候，相当于这10个人没有任何差别，这个时候让他们博弈的结果，就等同于大家抽签，十个里面随机抽三个；但是如果大家不是完全理性的，那么有些人会通过吓唬人，合纵连横等方式获得更大的优势，那么他们确实应该入选。

交钱拍卖号码。按损失多少分钱。（这样就算你的号码被重复，至少可以分钱啊）

精英社会也许无法最优解，但是可以相对公平。

这道题司马懿的答案是有问题的。因为题目在改变中，为什么不能讲悄悄话？

团队策略就是交流，团队交流就是讲悄悄话。

但是可以交流无执行力。

要破6人集团很简单，再组织一个新集团。

（有悄悄话更好，没有也可以）10-3/9-3 不影响结论。

做为loser的4位，再提出一个针对的提议：

做为选5，6,7的肯定失败的三位，我们再组团抽签，抽输的选8，9，10.

从而从100%失败变成接近1/2成功。

10个人各自从1-10选数字，尽量让自己最大且不重复，如何选？

网友意见

类似的话题

10个人各自从1-10选数字，尽量让自己最大且不重复，如何选？

女友20岁交往过10个男朋友，我们认识三天就上床啦，这样的女朋友可以继续发展么？请各位给一些具体建议？

哺乳动物有巴氏小体，单孔类有吗？单孔类雄性5个X5个Y，雌性10个X，如果有巴氏小体雌雄各几个？

如果10个人住在一间大房间里，其中只有一个人不抽烟，那么其他9个人应该抽烟吗？

适合10个人左右吃饭的电饭锅要多大容量

如果让你选10个人（任何人），和你一起回到古代和你一起建立国家。你会选哪几位？

矿难里埋了10个人救出来9个，他们为了活命杀死了其中一人该怎么判？

10 月全国个人住房贷款环比多增超千亿，这些数字说明了什么？

如何看待央行规定个人存取10万以上现金须登记，河北浙江深圳7月起试点大额现金管理？

如果以你个人损失10万元为代价换取全球新冠疫情的即刻结束，你愿意吗？

蒸米饭5个人大碗10碗大容量电饭煲要几升

22 年前被嘲养猪的北大学子，如今靠数字化养猪带领全村增收 10 倍，对个人择业有着怎样的启示？

如何看待云南个人出租住房将按 10% 税率征个人所得税？会带来哪些影响？

如何看待 2018 年外管局新规：个人银行卡境外取现总额每年不得超过 10 万？

今天是我戒烟的第101天，期间一根烟都没抽过，烟龄10年，每天我个人要净抽一包烟，能把烟戒掉，我自

10个身体素质顶尖并且精通人类已知的所有近身格斗招式的亡命之徒，能否赤手空拳打死老虎?

10个剑道高手拿顶级武士刀小空间死斗能不能斩杀一头大鬣兽？

10 个字可以写出什么样的微小说？

10个30发弹匣与3个100发弹鼓在装弹总数相同的情况下，重量完全一致吗？

10个3070民用电能挖矿吗？