甲藏起一枚 10 或 20 戈比的硬币，乙猜对则得到硬币，猜错则给甲 15 戈比。双方最优策略是什么？

这可真是一个有趣的数学博弈问题，咱们就来好好掰扯掰扯。

话说这甲乙二人，一个藏硬币，一个猜，这中间还夹杂着钱的输赢，这就是典型的博弈论场景。咱们就得从双方的角度出发，看看各自怎么做才能对自己最有利。

首先，咱们得明确一下双方的目标：

甲的目标：藏硬币，并希望能从乙那里“榨”到最多的钱，或者至少不吃亏。
乙的目标：猜中硬币，赢得硬币（虽然题目没说硬币本身的价值，但猜对能赢走硬币这本身就是一种胜利），并且尽量少地给甲钱。

硬币的情况：

甲藏的硬币是 10 戈比或 20 戈比。这俩硬币虽然面值不同，但对于乙来说，关键在于“猜对”和“猜错”的后果。

乙猜错的代价：乙要给甲 15 戈比。

现在，咱们站在乙的角度来思考：

乙要做的就是猜一次。他有两个选择：猜 10 戈比，或者猜 20 戈比。

乙猜 10 戈比：
如果甲藏的是 10 戈比（乙猜对了），乙得到硬币。
如果甲藏的是 20 戈比（乙猜错了），乙给甲 15 戈比。

乙猜 20 戈比：
如果甲藏的是 20 戈比（乙猜对了），乙得到硬币。
如果甲藏的是 10 戈比（乙猜错了），乙给甲 15 戈比。

从乙的角度看，他猜对硬币才能“赢”，猜错就得“赔钱”。硬币本身值多少钱，在乙猜错的情况下似乎不影响他赔出去的 15 戈比。所以，乙最关心的就是怎么提高猜对的概率。

接下来，咱们站在甲的角度来思考：

甲藏硬币，他也知道乙要猜。甲的策略就是决定自己藏 10 戈比还是 20 戈比。甲希望乙猜错，这样他就能赚到 15 戈比。

甲藏 10 戈比：
如果乙猜 10 戈比（乙猜对了），乙赢。
如果乙猜 20 戈比（乙猜错了），乙给甲 15 戈比。

甲藏 20 戈比：
如果乙猜 20 戈比（乙猜对了），乙赢。
如果乙猜 10 戈比（乙猜错了），乙给甲 15 戈比。

甲也想让乙猜错，这样他就能收入 15 戈比。

问题来了：双方有没有一个“最优策略”？

这里面关键在于，甲是知道乙要猜的，而乙也知道甲藏的是 10 或 20 戈比。但他们不知道对方的选择。

这就像一个“石头剪刀布”的游戏，只不过这次是“藏硬币”和“猜硬币”。

如果他们都采用“纯策略”：

假设甲总是藏 10 戈比。那么乙最好的策略是什么？乙猜 10 戈比猜对的概率是 100%，就能赢走硬币。乙猜 20 戈比猜错，要给甲 15 戈比。显然，乙应该猜 10 戈比。
假设甲总是藏 20 戈比。那么乙最好的策略是什么？乙猜 20 戈比猜对的概率是 100%，就能赢走硬币。乙猜 10 戈比猜错，要给甲 15 戈比。显然，乙应该猜 20 戈比。

假设乙总是猜 10 戈比。那么甲最好的策略是什么？如果甲藏 10 戈比，乙猜对。如果甲藏 20 戈比，乙猜错，乙给甲 15 戈比。所以，甲应该藏 20 戈比。
假设乙总是猜 20 戈比。那么甲最好的策略是什么？如果甲藏 20 戈比，乙猜对。如果甲藏 10 戈比，乙猜错，乙给甲 15 戈比。所以，甲应该藏 10 戈比。

看到没有？如果一方固定了自己的策略，另一方就能找到必胜（或者说最有利）的策略。但问题是，双方都知道对方会这么想。这就形成了一个僵局，没有哪个纯策略是绝对最优的。

这时候，就需要引入“混合策略”了。

混合策略的意思是，不固定地选择某一个行动，而是按照一定的概率来选择。

甲的策略：甲以一定的概率（比如 p）藏 10 戈比，以 (1p) 的概率藏 20 戈比。
乙的策略：乙以一定的概率（比如 q）猜 10 戈比，以 (1q) 的概率猜 20 戈比。

双方都希望通过调整自己的概率，使得无论对方如何选择，自己的期望收益（或者说损失）都是最小的（或者最大的）。

咱们来计算一下双方的期望收益（或者说净所得）：

这里我们假设硬币本身的价值不计入，只看乙给甲的 15 戈比。

1. 乙的期望收益（乙猜对赢硬币，猜错给钱）：

乙猜 10 戈比 (q)：
甲藏 10 戈比 (p)：乙猜对，收益是赢得硬币（咱们算作 0，因为更关注钱）。
甲藏 20 戈比 (1p)：乙猜错，乙给甲 15 戈比，乙的收益是 15。
乙猜 10 戈比的期望收益 E(乙 | 猜 10) = p 0 + (1p) (15) = 15(1p)

乙猜 20 戈比 (1q)：
甲藏 10 戈比 (p)：乙猜错，乙给甲 15 戈比，乙的收益是 15。
甲藏 20 戈比 (1p)：乙猜对，收益是赢得硬币（算作 0）。
乙猜 20 戈比的期望收益 E(乙 | 猜 20) = p (15) + (1p) 0 = 15p

乙希望最大化自己的期望收益，所以他会选择让 E(乙 | 猜 10) 和 E(乙 | 猜 20) 相等的那个 p。也就是说，在乙看来，甲的 p 应该让乙猜哪个都一样“不划算”（或者说损失一样）。

E(乙 | 猜 10) = E(乙 | 猜 20)
15(1p) = 15p
15 + 15p = 15p
30p = 15
p = 15/30 = 1/2

所以，从乙的角度看，甲最好的策略是：以 50% 的概率藏 10 戈比，以 50% 的概率藏 20 戈比。这样，无论乙猜 10 还是猜 20，乙的期望收益都是 15 (1/2) = 7.5 戈比。乙猜对硬币是“赢”，但是他期望输掉 7.5 戈比（因为他猜错时给的钱）。

2. 甲的期望收益（甲藏硬币，乙猜错乙给钱）：

甲藏 10 戈比 (p)：
乙猜 10 戈比 (q)：甲没收到钱（乙猜对）。
乙猜 20 戈比 (1q)：甲收到 15 戈比（乙猜错）。
甲藏 10 戈比的期望收益 E(甲 | 藏 10) = q 0 + (1q) 15 = 15(1q)

甲藏 20 戈比 (1p)：
乙猜 10 戈比 (q)：甲收到 15 戈比（乙猜错）。
乙猜 20 戈比 (1q)：甲没收到钱（乙猜对）。
甲藏 20 戈比的期望收益 E(甲 | 藏 20) = q 15 + (1q) 0 = 15q

甲希望最大化自己的期望收益，所以他会选择让 E(甲 | 藏 10) 和 E(甲 | 藏 20) 相等的那个 q。

E(甲 | 藏 10) = E(甲 | 藏 20)
15(1q) = 15q
15 15q = 15q
30q = 15
q = 15/30 = 1/2

所以，从甲的角度看，乙最好的策略是：以 50% 的概率猜 10 戈比，以 50% 的概率猜 20 戈比。这样，无论甲藏 10 还是 20，甲的期望收益都是 15 (1/2) = 7.5 戈比。

结论：双方的最优策略就是采用“混合策略”，且概率都是 50/50。

甲的最优策略：每次都以 50% 的概率藏 10 戈比，以 50% 的概率藏 20 戈比。
乙的最优策略：每次都以 50% 的概率猜 10 戈比，以 50% 的概率猜 20 戈比。

为什么这是最优的？

当双方都采用这种 50/50 的混合策略时，就没有哪一方能够通过单方面改变自己的策略来获得比现在更好的结果。

对甲来说，无论乙怎么猜（是 50/50 还是固定猜一个），甲采用 50/50 的策略，他平均而言都能赚到 7.5 戈比。如果甲固定了藏 10 戈比，而乙也 50/50 猜，甲的期望收益是 7.5 戈比。如果乙固定猜 10 戈比，甲藏 20 戈比就能稳赚 15 戈比，但甲不知道乙会固定猜哪个，所以 50/50 的随机性最保险。
对乙来说，无论甲怎么藏（是 50/50 还是固定藏一个），乙采用 50/50 的策略，他平均而言都会“损失” 7.5 戈比（也就是从甲那里净赚 7.5 戈比）。如果乙固定猜 10 戈比，而甲也 50/50 藏，乙的期望收益是 7.5 戈比。如果甲固定藏 10 戈比，乙猜 10 戈比就能赢硬币，但是乙不知道甲会固定藏哪个。

这种 50/50 的概率组合，让游戏进入了一个“纳什均衡”的状态。在这个状态下，任何一方都无法通过单方面改变策略来改进自己的收益。

举个例子来理解这个“50/50”：

想象一下，他们玩了很多很多轮。

如果甲总是藏 10 戈比，乙肯定每次都猜 10 戈比，乙永远赢。
如果乙总是猜 10 戈比，甲肯定每次都藏 20 戈比，甲每次都能赚 15 戈比。

但是，他们都知道对方会这么想。所以，为了不被对方“算死”，他们只能也“随机”起来。

甲心里想：“乙可能会猜 10，也可能猜 20。我不能老藏一个，要不就被他摸透了。我每次都抛硬币，正面藏 10，反面藏 20。”

乙心里想：“甲可能会藏 10，也可能藏 20。我不能老猜一个，要不就被他摸透了。我每次也抛硬币，正面猜 10，反面猜 20。”

这样一来，甲藏 10 乙猜 10，甲藏 10 乙猜 20，甲藏 20 乙猜 10，甲藏 20 乙猜 20 的情况，发生的概率都是 0.5 0.5 = 0.25。

甲藏 10，乙猜 10：乙赢。甲给乙 0 戈比。
甲藏 10，乙猜 20：乙猜错，乙给甲 15 戈比。
甲藏 20，乙猜 10：乙猜错，乙给甲 15 戈比。
甲藏 20，乙猜 20：乙赢。甲给乙 0 戈比。

从甲的角度看，在 4 种等概率发生的情况下，他赚了 15 戈比两次，没有赚（或赔）钱两次。所以他平均每次的收益是 (15 + 0 + 15 + 0) / 4 = 30 / 4 = 7.5 戈比。

从乙的角度看，他赢了两次硬币（算作 0 戈比），输了 15 戈比两次。所以他平均每次的收益是 (0 + (15) + (15) + 0) / 4 = 30 / 4 = 7.5 戈比。

这个结果，就是双方都无法做得更好的状态了。甲的 50/50 策略，让他无论如何都能平均赚到 7.5 戈比，并且让乙无法预测。乙的 50/50 策略，让他无论如何都会平均损失 7.5 戈比（也就是从甲那里净收益 7.5 戈比），并且让甲无法预测。

这就是一个典型的零和博弈（甲赚的钱正好是乙赔的钱，这里咱们简化了硬币本身价值），并且双方都采取了最优的混合策略。

网友意见

题目有意思。

1，楼主别被某些人的名词所吓倒。我觉得你解得对。

2，没有根据上一个结果能优化后面的策略。考虑随机性。

3，个人感觉生物学和经济学显然应该有类似案例，（比如生物学的随机变异导致的进化优势，

以及经济学上股票的随机性等可能会有符合最优解的结论。）

类似的话题

甲藏起一枚 10 或 20 戈比的硬币，乙猜对则得到硬币，猜错则给甲 15 戈比。双方最优策略是什么？

这可真是一个有趣的数学博弈问题，咱们就来好好掰扯掰扯。话说这甲乙二人，一个藏硬币，一个猜，这中间还夹杂着钱的输赢，这就是典型的博弈论场景。咱们就得从双方的角度出发，看看各自怎么做才能对自己最有利。首先，咱们得明确一下双方的目标：甲的目标：藏硬币，并希望能从乙那里“榨”到最多的钱，或者至少不吃.............
甲家里有一块1kg的金条，乙偷偷把金条换成了1.1kg的（品质相同），乙是否构成盗窃？

这是一个非常有趣的案例，涉及到“盗窃”的构成要件以及如何理解“财物”本身。要判断乙是否构成盗窃，我们需要深入分析《中华人民共和国刑法》中关于盗窃罪的规定，并结合本案的具体情况进行剖析。一、盗窃罪的构成要件根据我国刑法，盗窃罪是指以非法占有为目的，盗窃公私财物的行为。构成盗窃罪一般需要满足以下四个基.............
甲对乙说：“给我磕一个头给1千。”那如果乙磕受伤了，甲犯法吗？

这种情况，咱们得分情况来聊。甲对乙说“给我磕一个头给1千”，这本身就有点奇怪，但如果乙真的磕了，并且磕伤了，甲是否犯法，这事儿可就复杂了，不能一概而论。首先，我们要明白，在法律上，这种“交易”能不能算得上是合法的，就存在很大的疑问。一、构成强迫交易罪的可能性如果甲的说法，是在一种胁迫或者欺骗的手段.............
甲有碱面100克，向乙谎称系海洛因，让其出卖并获利2万元，请问甲乙是否构成贩卖毒品罪的共犯?

关于甲乙是否构成贩卖毒品罪的共犯，这需要根据我国刑法关于共犯的构成要件以及贩卖毒品罪的具体规定来分析。首先，我们来梳理一下案件的事实：甲的行为：拥有碱面100克。向乙谎称碱面是海洛因。指使或诱使乙出卖该“海洛因”。目的是为了获利2万元。 .............
甲开车撞到乙，致乙受伤，丙再继甲撞到乙，致乙死亡，若两者造成的伤害一样，问：甲丙谁责任最大？

这个问题看似简单，但背后牵扯到侵权责任认定的复杂性，尤其是在多人侵权行为中。咱们得仔细掰扯掰扯，看看甲和丙谁的责任更大一些。首先，咱们要明确一个基本原则：侵权责任是根据每个人在侵权行为中的过错程度以及造成的损害来确定的。这里的“损害”包括人身伤害和财产损失。在这个案例里，虽然两个人撞了同一个人，但撞.............
甲用毒汤圆杀乙，喂食速度过快，乙被噎死，甲定什么罪？

这个问题很有意思，咱们得好好掰扯掰扯。甲用毒汤圆想弄死乙，这念头一出来，就已经犯了重罪的根儿了。他这是赤裸裸的故意杀人，这罪名跑不了。关键就在于，这汤圆喂得太快了，结果把乙给“噎死”了。这就好比你本来想用刀捅死他，结果刀没捅准，反而把他吓得心脏病发作死了。这中间隔了层“噎死”这个意外，那判罪的时候就.............
甲有101个硬币，乙有100个硬币，两人随机撒在地面上，甲比乙正面朝上多的概率是多少？

这个问题很有意思，我们可以一步一步来算。首先，我们得明确一个概念：抛硬币的独立性。甲抛硬币的结果和乙抛硬币的结果是完全分开的，谁抛出正面或者反面，都不会影响到另一个人。我们假设每一枚硬币抛出正面和反面的概率是相等的，也就是 0.5（五五开）。第一步：设定变量，明确我们要计算什么设甲抛出正面朝上.............
甲南大学和东京经济大学各自的优势是什么?

好的，咱们来聊聊甲南大学和东京经济大学各自的亮点，尽量把话说得透彻些，也让这篇文章读起来更有人情味儿。甲南大学：关西的低调贵族，注重综合素养与实践甲南大学，很多人可能第一反应是“哦，那个在神户的大学”。没错，它就坐落在风景优美的兵库县神户市，这个地理位置本身就自带一份精致和从容。甲南大学给人的感觉，.............
甲为救困在火场里的乙，将乙的梨花木大门一脚踹碎，乙可以要求甲赔偿大门费用吗？有何法律依据？

这个问题很有意思，涉及到我们生活中常见的紧急情况下的行为和法律责任。简单来说，乙可以要求甲赔偿大门费用，但甲很可能不需要赔偿，因为他很可能可以依据法律的规定，主张自己的行为是“正当防卫”或者“紧急避险”，从而免除赔偿责任。我们来详细地聊聊这其中的法律逻辑和依据。一、为什么乙可以要求赔偿？（表面上看.............
甲持刀走向乙欲抢劫，乙发觉后扔下包里的现金就跑，甲拾得现金。是抢劫罪什么形态？

这是一个典型的抢劫既遂的案例。咱们来仔细掰扯一下，为什么是抢劫既遂，而不是其他什么阶段。首先，咱们得明确抢劫罪的构成要件。抢劫罪，简单说，就是用暴力、胁迫、或者其他方法，强行夺取他人财物的行为。这其中几个关键词很重要：“暴力、胁迫、其他方法”、“强行夺取”、“他人财物”。在这起事件里：甲持刀走.............
甲州武田和骏河今川哪个才是真正的名门?

在战国乱世的日本，名门望族的头衔从来不是一成不变的，它伴随着家族的兴衰、权力的更迭以及历史的评价而流动。对于甲州武田氏和骏河今川氏，两者都拥有深厚的历史根基和显赫的过往，但若要论“真正的名门”，需要从多个维度进行审视，并剥去时间的滤镜，才能更贴近历史的真实。甲州武田氏：从源氏血脉到战国霸主武田氏的.............
甲铁城的卡巴内瑞中，美马的思想是不是纳粹主义？

在《甲铁城的卡巴内瑞》这部作品中，美马的思想确实与纳粹主义有着一些令人不安的相似之处，但要将其简单地等同于纳粹主义，可能又过于绝对。我们不妨从几个关键的方面来剖析一下，看看他的理念究竟是怎么一回事，以及为什么会让人联想到那个黑暗的历史时期。首先，我们来看美马的核心理念——“净化”。美马坚信，人类为了.............
甲由一扫光蟑螂药使用方法每个小盒外面的塑料包装用去掉吗

.......
甲县杨某在乙县商场买了产于丙县的电磁炉导致在丁县的家爆炸了,问民事诉讼不？

.......
甲要到沙漠旅行，乙是甲的仇人，就在甲的水壶里下了毒药，要毒死甲。。丙看到了乙下毒药的行为，

.......
甲、乙、丙三个同学分别拿着2个，1个，3个暖水瓶在排列打水，热水壶上只有一个水龙头．按______顺序，可

.......
甲癌术后一定要戒烟吗

.......
甲乙丙三个人分别在蚂蚁森林中收集能量有一次三人收集的零能量为连续奇数它们？

.......
轻甲甚至无甲的长枪兵打得过一身重甲的刀盾兵吗?

这个问题很有意思，也挺实际的，能打得过，但绝不是轻松就能赢，而且要看具体情况。咱就好好唠唠这个事儿。先说说咱们的双方选手：轻甲/无甲长枪兵：优点：速度快、机动性强：没穿那么多铁疙瘩，跑得跳得自然方便多了。这意味着他们能更好地调整站位，规避攻击，寻找有利角度。攻击范.............
中甲中乙多达十几支球队可能解散，其根本原因是什么？长远看对中国足球有什么影响？

中甲、中乙联赛濒临解散的球队数量之多，的确触目惊心。这绝非偶然，而是中国足球长期以来积弊丛生、多重因素叠加作用下的必然结果。要探究其根本原因，需要深入剖析中国足球的经济、管理、青训以及社会大环境。根本原因的剖析：1. 畸形的经济模式与生存危机： “金元足球”的后遗症与泡沫破灭：过去几.............