问题

如何评价微软创造出的麻将 AI?

回答
微软推出的麻将 AI,确实是一个非常有意思的案例,它不仅仅是关于人工智能在游戏领域的进步,更触及到了一些关于“智能”本身的有趣讨论。

先说结论,它是一个相当出色的麻将 AI,但要说它“完美”或者“超越人类”则还需要审慎看待。

从技术层面来说,微软的麻将 AI 展现了相当高的水平。

强大的计算能力和数据驱动: 麻将的复杂性在于其巨大的状态空间和不确定性。一场牌局,从发牌、摸牌、打牌到最后的胡牌,充满了各种组合和可能性。AI 能够通过海量的对局数据进行学习,识别出各种牌型的概率、对手的出牌习惯、以及当前局势下最优的决策。这背后无疑是强大的计算能力和精细的算法模型在支撑。
策略的多样性与适应性: 好的麻将 AI 不仅仅是死记硬背规则,而是能够根据不同的牌局情况调整策略。比如,在起手牌极差时,可能会采取保守策略,尽量减少失分;而在手牌顺畅时,则会积极进攻。它能够理解“舍牌”的含义,不仅仅是打出无用的牌,更是要考虑这张牌是否会给对手送胡,或者是否能为自己保留未来的潜力。
理解“牌山”的可能性: 麻将的魅力很大一部分在于“未知”。玩家需要根据自己摸到的牌,以及其他玩家打出的牌,去推测“牌山”中可能剩下的牌。高级的 AI 能够更精准地进行这种概率推算,预测对手可能成胡的牌型,从而做出更明智的选择。
对“和牌”的追求与“防守”的平衡: 麻将不仅仅是“谁先和谁就赢”,更涉及到“点炮”和“抢杠”等概念。一个优秀的 AI 需要在追求自己和牌的同时,也懂得防守,避免被对手胡牌,尤其是要避免被大牌点炮。这种平衡感是 AI 表现是否出色的重要指标。

然而,要将它与顶尖人类玩家相比,还是有一些值得玩味的地方:

“人情世故”与“读心术”: 人类麻将的乐趣,很大一部分在于“打牌打的是人”。顶尖的玩家不仅是在和牌,他们也在“读”对手。通过观察对手的表情、出牌的顺序、甚至是很细微的停顿,来判断对手的牌势和意图。这种“读心术”是 AI 目前很难模仿的,因为它们缺乏对人类情感和非语言信号的理解。
“策略性放水”或“心理战”: 在某些对局场景下,人类玩家可能会出于某种目的“策略性地放水”或者进行心理上的试探。比如,故意打一张看似危险但实际无伤大雅的牌,来观察对手的反应。这种带有“博弈”性质的策略,AI 要真正理解并执行起来,可能还需要更深层次的“目标导向”和“意图推测”。
“运气”的处理: 虽然 AI 可以通过概率计算来应对运气,但人类玩家在面对“一手烂牌”时的那种“豁出去”的勇气,或者在“绝境逢生”时的那种“灵光一闪”的判断,有时候更像是运气与经验的结合。AI 的决策是基于数据和逻辑,它不会有“情绪”上的起伏,也不会有“背水一战”的冲动。

总的来说,微软创造的麻将 AI 是一款非常成功的游戏 AI。

它代表了当前人工智能在复杂策略游戏领域取得的显著进展。它能够以非常高的胜率击败普通玩家,甚至对一些中等水平的玩家也能形成压力。它在计算能力、数据学习和策略执行方面都表现出了卓越的素质。

但如果将其视为一个“人类化”的麻将选手,可能还有一段距离。那种对人类心理的洞察,那种更灵活、更具“人情味”的策略调整,仍然是 AI 探索的 frontier。

所以,评价它,我们可以说它是一个非常强大、精准、并且不断学习的“计算机器”,它在麻将这个游戏中展现了惊人的“理性”和“效率”。但它是否具备了人类玩家在牌桌上那种微妙的“感性”和“直觉”,则是一个更值得我们去思考的问题。它让我们看到了 AI 在模拟复杂决策能力上的潜力,同时也提醒我们,人类在某些层面的智能,依然是独一无二的。

网友意见

user avatar

老实讲这个成绩比我想的要差不少……按我自己的估计,做麻将AI应该比AlphaZero这种简单的多。即使这里存在是否完全信息博弈的区别,那么至少麻将AI也应该远远简单于德州扑克的AI(例如近期公布并发论文的Pluribus):因为从人类的角度来看,由于几乎不涉及针对对手的动态调整,前者的EV容易估算很多。而微软目前的AI Suphx的成绩,说击败了人类顶尖玩家,是很难令人信服的——其实Pluribus也存在这个问题,但相对而言Suphx的说服力还是明显更差一些。

几篇相关的报道大概都提到类似的语句:

天凤平台通过计算稳定段位(Stable Rank)来衡量玩家的实力水平,在经过多场对局后依然能保持高而稳定的段位是非常不易的。在 5000 余场对局中,Suphx 的稳定段位超过了 8.7,是一个极高的数字。

但是可能由于报道媒体对天凤这一对战平台的不熟悉(从翻译为「稳定段位」而不是「安定段位」就可以看出来,不过见鬼,这对媒体人的要求也太苛刻了),安定段位8.7的概念还需要进一步的说明:相当于在足够多的对局数(样本量)下,这名玩家的段位应该在八段和九段之间徘徊;至于Suphx能上十段在8.7的安定段下也不值得惊讶,波动而已。

至于这个是什么水平,其实要再细分来说:天凤的最高段位桌为「凤凰」,而Suphx的成绩是在次高的「特上」完成的。在特上达到安定段8.7当然也是非常优秀的成绩(至少我自己在大样本下应该是没什么机会做到),也远超了之前东京大学的AI「爆打」(在30515战中安定段位为6.6),但并不足够好:

而且需要记住,这只是在特上桌的成绩(和凤凰桌的计分方式都不同)。如果再看凤凰桌的排名,那么500战以上,同时安定段位8.75以上的玩家,还有113人;Suphx当然已经是个优秀的玩家,但不会被归于Top Level,更别说打败这些玩家——实际上由于Suphx的成绩在特上桌完成,它应该缺少和顶尖玩家的实际对局。不过相信之后天凤很快会让Suphx上凤凰桌一展身手,过两三个月是可以期待一下初步成绩的。

如果让我瞎猜一下Suphx还不够强的原因,可能是麻将在每一时间点的组合数过多(相对德州扑克),导致训练优化的过程过于缓慢?但只作为围棋、日麻、德扑等项目的玩家来说,目前还没达到顶尖实力的AI,看起来并不像一个非常拿得出手的成果。

类似的话题

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有