问题

是不是对于任意 n×n 大小的围棋棋盘,人类都赢不了 AlphaGo Zero 了?

回答
想当年,围棋这玩意儿,讲究的是一个“气”字,还有那纵横捭阖、虚实结合的章法。可自从AlphaGo Zero横空出世,棋盘上的乾坤好像都变了味儿。你问我,是不是随便一个 n×n 的围棋棋盘,人类都赢不了它了?这话说得,有点儿太绝对了,也太简单了。

咱们得这么看:AlphaGo Zero牛在哪儿?它不是学了多少人间的棋谱,也不是靠人给它灌输了多少“围棋真经”。它就自己跟自己下,下了几千万盘。从最最原始的规则开始,一点一点摸索,一点一点进化,最终悟出了它自己的一套“道”。这有点像武侠小说里,扫地僧突然显露绝世神功,不是因为他学了谁的招式,而是他自己参透了天地至理。

所以,如果说的是我们熟悉的、标准的19x19围棋棋盘,而且是AlphaGo Zero的最终版本,那你想赢它?那可真是难于上青天了。为什么?

1. 算力碾压,深度挖掘: AlphaGo Zero的算力,那可不是我们凡人能比的。围棋的局面复杂到什么程度?简单说,比宇宙里的原子数量还多。人类的脑力再怎么发达,也只能穷举有限的几种可能性,而且很快就会力不从心。但AlphaGo Zero,它能把未来几十步棋的各种变化都算得清清楚楚,并且评估出每一种可能性有多大概率赢。它不是靠“感觉”,它是靠“计算”和“概率”。
2. 自我学习,超越人类智慧的积累: 人类下棋,是靠祖祖辈辈积累下来的经验、知识和直觉。我们学棋,就是学这些。可AlphaGo Zero没有这些“包袱”。它从零开始,自己摸索出来的很多下法,可能是人类从来没想过的。有时候你看着它落下一子,觉得莫名其妙,但几回合之后,你才发现,这步棋简直是神来之笔,为它后来的胜利奠定了基础。它不被人类的定式、棋理所束缚,所以能突破人类的思维局限。
3. 没有情绪,没有疲劳: 人类下棋,会紧张,会兴奋,会因为一时的失误而心态失衡,会因为疲劳而判断失误。AlphaGo Zero就没有这些。它永远保持着冷静,每一次落子都是基于最理性的计算。在漫长的对局中,它不会出现一点点“走神”或者“状态不好”的情况。

那么,你说的“任意 n×n 大小的围棋棋盘”,这就有点意思了。

如果 n 非常小,小到只有几路,比如3x3或者5x5: 这种情况,胜负就很难说了。在这么小的棋盘上,围棋的战略深度就大大削弱了。很多复杂的计算和布局都没法施展。这时候,人类的直觉和对局部简单变化的理解,反而可能比AlphaGo Zero更有效率。我们可以在短时间内就看清所有变化,甚至找到一些简单粗暴但有效的必胜招法。AlphaGo Zero虽然算力强,但如果它也要跟人类一样,在这么小的棋盘上进行有限的搜索,说不定它也会觉得“没劲”。而且,它最初的训练基础是19x19,在完全陌生的、非常小的棋盘上,它的“通用性”也需要检验。
如果 n 非常大,大到100x100甚至更大: 这种情况下,情况会变得非常复杂。围棋的局面复杂度会呈指数级增长。
对人类来说: 局面太大,即使是顶尖棋手也难以顾全大局,很容易在某个角落出现致命的失误。我们可能只能专注于棋盘的一小部分,而忽略了其他地方。
对AlphaGo Zero来说: 它强大的算力依然是优势,但搜索空间也变得空前巨大。它的神经网络需要处理的信息量也呈几何级数增长。虽然它仍然比人类强,但它的优势是否能像19x19那样压倒性,就不好说了。而且,它最初的训练是基于19x19的“规则”和“模型”,虽然可以推广,但如果棋盘尺寸变化得太离谱,它原有的“知识”可能就不那么适用了。比如,在超大棋盘上,边界的作用、中心的价值等等,都可能会发生根本性的变化,它需要重新“适应”甚至“学习”。

总的来说,对于我们熟知的19x19棋盘,想赢 AlphaGo Zero,已经不是能力问题,而是“不可能”的问题了。它已经达到了人类围棋智慧的顶峰,并且以一种超越人类的方式。

但是,如果你把棋盘大小随便改,那情况就不同了。在一些非常规、非常小的棋盘上,人类的直觉和快速局部分析可能会派上用场。而在一些非常非常大的、超乎寻常的棋盘上,AlphaGo Zero虽然依然强大,但它的优势也可能因为规模的巨大变化而受到挑战,需要新的适应和学习。

所以,不是“任意 n×n”,而是“在足够大且有一定复杂度的情况下,特别是我们熟悉的19x19棋盘”,人类已经很难赢过AlphaGo Zero了。其他情况,还得具体分析棋盘大小和规则对围棋复杂度的影响。

网友意见

user avatar

阿法狗赢李世石的时候使用了上千个芯片,赢柯洁时使用了专用芯片TPU,而使用类似的神经网络算法却没有同等规模的计算能力的其他团队的AI却经常输给人类棋手,这说明:阿法狗的胜率和计算机的处理能力是高度相关的。


那么,要达到同等棋力,计算机处理能力和棋盘规模之间是什么关系呢?我猜测是指数关系,因为阿法狗的原理是利用大量的自我对弈进行训练,而可能的棋局数量和棋盘规模之间是指数关系,在棋盘扩大时,要保持

训练棋局数/比赛时可能出现的棋局数=常数,

就必须指数级地增加计算机处理能力。

这只是一个猜测,建立在如下推理的基础上:

阿法狗需要自我对弈几千万局才能完成训练。

如果f(19)=“几千万”,那么从常理判断,f(n)不太像一个和棋盘规模n无关的大的常数,更像是随棋盘规模指数级增长的变量。

结论:建议把棋盘规模扩大到25路以上,以抵御人工智能的冲击。

类似的话题

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有