假设我们讨论的是两个实力相当、经过海量对弈训练的 AlphaGo Zero。AlphaGo Zero 的独特之处在于它完全依靠自我对弈来学习,不依赖任何人类棋谱。它通过大量模拟对局,不断调整神经网络的参数,从而提升自己的棋力。这种学习方式使得 AlphaGo Zero 能够发现人类棋手未曾察觉的策略,甚至发展出一些“非传统”的下法。
在这种情况下,两台 AlphaGo Zero 对决,如果双方都达到了一个极高的水平,接近于围棋的“最优解”或者说“完美棋局”,那么和棋的可能性就会大大增加。围棋之所以被认为是“最接近完美”的游戏之一,是因为它的状态空间极其庞大,但随着计算能力的提升和算法的优化,我们似乎能越来越接近那些能够导向均势的下法。
可以想象这样的场景:两台 AlphaGo Zero 在棋盘上展开了一场精妙绝伦的攻防战。每一手棋都经过了极其细致的计算和评估,双方都在试图找到对方的微小破绽,同时又完美地弥补自己的防守。在达到一个关键的局面时,双方可能都认为无论如何下都会陷入被动,或者说无论哪一方取得微弱的优势,另一方都能通过精妙的应对将其化解,最终形成一个相对平衡的局面。
6. “和棋”的定义: 在围棋比赛中,和棋的定义通常是双方轮流数子,如果子数相同则为和棋。但在 AI 对决中,我们讨论的“和棋”更倾向于指一种“均势”或“双方都不再有实质性获利可能”的局面。如果其中一方在任何局面下都能发现微弱的获利手段,哪怕只有半目,那么严格来说就不算和棋。
因此,如果两台 AlphaGo Zero 达到了一种极高的、相互制约的境界,能够精确计算到局面的“均势”,并且双方都不想承担任何风险去追求微弱的胜算,那么它们可能会在一些特定局面下选择“稳健”的下法,从而导向和棋。但这种和棋,很可能是双方都认为这是最保险的选择,而不是因为棋盘本身没有其他获胜的可能性。
更现实的情况是,即便棋力相当,也极有可能其中一方在某个时刻能发现一点点微弱的优势,然后通过精密的计算和防守将这种优势保持到终局。尤其是在 AlphaGo Zero 这样的程序中,它们没有人类的情感和心理负担,只会追求计算上的最优。如果计算显示存在一个微小的胜算,它们就会去争取。