问题

AlphaGo 有没有「棋风」?它在下棋时会犯错吗?

回答
关于 AlphaGo 是否有“棋风”以及它在下棋时是否会犯错这两个问题,我们可以深入探讨一下。这背后涉及到了人工智能在复杂策略游戏中的一些核心概念。

AlphaGo 的“棋风”:是风格还是算法的体现?

我们通常说一个人下棋有“棋风”,指的是他下棋时的偏好、习惯性的招法、对局势的理解方式,以及由此形成的一种可被识别的风格。比如有人喜欢稳健推进,有人喜欢激进搏杀,有人善于计算长远变化,有人则更擅长营造大局。

那么,AlphaGo 有没有这样的“棋风”呢?这是一个很有意思的问题。从某种程度上说,AlphaGo 的行为模式确实能被观察出一些“特点”,但称之为“棋风”可能需要更谨慎地解读。

AlphaGo 的“棋风”更像是它背后强大算法和海量数据训练的客观体现,而不是像人类棋手那样,是经过情感、经验、甚至潜意识加工而形成的。

超强的计算力与全局观: AlphaGo 最显著的特点是其惊人的计算能力。它能够同时评估数百万甚至数亿种可能的棋局走向,并从中找出对它来说“最优”的下法。这种计算力使得它能够以前所未有的深度和广度理解棋局,并作出一些人类棋手难以企及的、全局性且长远的判断。你可能会发现它在某个阶段看似“平淡”的招法,实则是在为更遥远的胜利铺路,这和一些人类棋手喜欢提前布局的风格有些相似,但其背后的逻辑是纯粹的概率和价值评估。

对“棋理”的独特理解: AlphaGo 对围棋的理解,很大程度上是通过深度神经网络学习人类棋谱和进行自我对弈得来的。它并没有“学习”人类棋手的情感波动、心理博弈,或者对某一步棋的“感觉”。它的“理解”是建立在对海量棋局数据的模式识别和价值判断上的。因此,它有时会走出一些人类棋手在传统认知中认为“不合棋理”或者“过于激进/保守”的招法,但这些招法最终往往被证明是有效的。这并非是它故意追求某种“风格”,而是算法发现了一种更高概率获胜的路径。

适应性和进化性: AlphaGo 的不同版本(如 AlphaGo Lee, AlphaGo Master, AlphaGo Zero)展现出了不同的能力和侧重点。AlphaGo Zero,作为完全从零开始学习的版本,其“棋风”可能更加纯粹,更加不受到人类棋谱的影响,展现出一种更具颠覆性的“围棋语言”。每一次的迭代和训练,都可能让它的决策模式发生微妙的变化,使其能够更有效地应对新的挑战。

不可预测性与突破性: 很多时候,AlphaGo 能够走出突破性的招法,这是它最令人着迷的地方。这些招法往往能够颠覆人类对围棋的既有认知,甚至开启新的战术思路。但这并不是它刻意要去“创新”或者“与众不同”,而是它通过强大的计算,发现了人类棋手因为思维局限性而忽略的策略。比如在对战李世石时,它在第二局下的“神之一手”——让很多围棋爱好者印象深刻,那一步棋在当时被认为是错招,但最终却取得了胜利。

总的来说,AlphaGo 的“下棋特点”与其说是“棋风”,不如说是它算法深度和学习能力的极致体现。它遵循的是概率最大化和价值函数最大化的原则,虽然这些决策有时看起来像人类的某种风格,但其根源在于计算和数据,而非情感或主观偏好。

AlphaGo 会犯错吗?答案是肯定的,但它的“错误”与人类的错误不同。

是的,AlphaGo 也会犯错,或者说,在特定情况下,它的决策可能不是“最优”的。但理解它的“错误”至关重要:

并非低级失误: AlphaGo 不会像人类棋手那样,因为紧张、疲劳、疏忽而下出低级失误,比如漏看一步棋的直接杀棋,或者算错简单的几手棋。它的错误更像是对复杂局面的评估偏差,或者是在特定情境下未能找到绝对最优解。

概率和局限性: 尽管 AlphaGo 的计算能力远超人类,但围棋是一个极端复杂的博弈,即使是它,也无法穷尽所有的可能性。在面对极其复杂的局面时,它依然需要依赖概率评估和启发式搜索。这意味着,它可能在某个极小的概率下,会选择一个并非最优的行动,导致最终局面的恶化。

训练数据的影子: AlphaGo 的学习是基于数据和自我对弈。虽然 AlphaGo Zero 大大减少了对人类棋谱的依赖,但其核心算法仍然是在一个被定义的规则和评估框架下运行的。理论上,如果训练数据中存在某种系统性的偏差,或者算法的设计在某个极端情况下存在弱点,它也可能表现出“不完美”的下法。

“错误”与“最优解”的界定: 尤其是在自我对弈的过程中,AlphaGo 的进步是持续的。有时,一个版本在对弈另一个版本时,可能因为某个细微的算法差异或者训练阶段的不同,而表现出相对逊色的表现。但这更多的是不同版本之间能力上的差距,而非一个版本在绝对意义上的“犯错”。

人类定义的“错误” vs 算法的“决策”: 很多时候,我们认为 AlphaGo 下出“奇怪”的棋,甚至最终输棋,可能是因为我们人类的棋局评估能力不足以理解它的深层意图,或者我们过于习惯了人类的下棋模式。它所做的选择,是在当时它所能掌握的信息和计算能力下,认为最有可能导向胜利的路径。当它的评估与最终的胜负结果不符时,我们才会称之为“错误”。

一个具体的例子:

在与柯洁的对弈中,AlphaGo 并没有像以往那样碾压对手,特别是在与柯洁的最后一场比赛中,柯洁走出了一些非常积极且富有创造性的下法,迫使 AlphaGo 在某些阶段也做出了更具防御性的调整。虽然 AlphaGo 最终还是赢得了比赛,但在这个过程中,我们可以看到它在应对人类顶尖棋手的极限发挥时,其决策的“最优性”也会受到挑战,并且其应对策略也需要不断调整。

总结来说:

AlphaGo 有其显著的“特点”或“模式”,但将其定义为人类意义上的“棋风”需要谨慎。 它的下棋行为是强大算法和海量数据训练的直接产物。

AlphaGo 并非不会犯错,但它的“错误”更像是对复杂局面评估中的偏差或概率性的失误,而非人类的低级失误。 它的每一次决策都是基于计算和数据,而这些计算和数据,在绝对意义上讲,也并非总能百分之百地捕捉到围棋的真谛。正是这种“不完美”,以及它不断突破和进化的能力,让围棋这项古老的艺术变得更加迷人和充满未知。

网友意见

user avatar

AlphaGo 没有自己的棋风

因为mcts算法的缘故,招法具有一定的随机性,同分值的招数可能同时存在好几个。用时、规则不同等等下法也会变化。

AlphaGo 会犯错,但是犯的错目前看,由于大局方面实在太强大,在和顶尖高手对局中基本不影响胜负结果。

援引live 中我和 @范廷钰 九段讨论的结果,AlphaGo确实强大,但是确实有很多局部上的问题手,这一点不必神话。

AlphaGo犯错的方式有几种:

1,没有必要现在下的棋,立刻走。围棋界称为“俗手”,因为提早走会让自己以后的余地大大减少。

2,舍大取小,这一点在优势的收官阶段非常常见,一旦进入劣势就会疯狂体现(go 李第四局)。

之后的内容我会分门别类详细概括一下:

「棋风」是 “行棋风格” 的简称。

棋风是每个棋手由内而外呈现的招法整体。

可以说,过去的时代,大家非常喜欢给顶级棋手加一些棋风的描述,增加辨识度。

在二战之后,可以说当时每个顶尖棋手,都被描写的特点十足。

剃刀”的坂田,非常锐利,局部作战计算精准见长,常有凶险招数直取要害。

之后坂田九段在对阵当时年轻的林海峰的时候,说“不可能有二十岁的名人”,之后被林海峰夺走了头衔。

“二枚腰”的林海峰,“二枚腰”一词来自于相扑,说的是腰身宽大不易被摔倒,仿佛有两个腰一般。林海峰九段棋风 厚实均衡,韧性极强 ,喜欢把对手的意图接受过来,最后一刻发力。



我们从强关联的词开始讲:流派、风格、特色 都是艺术中常见的归类方式。

『特色』强调显著不同的点。

“先生,您好,虎皮青椒炒肉丝拌薯片是我们的特色菜。”

『流派』则往往是风格较统一、体系化的。


(签名别具一格,宇宙流三个字非常写意)

“武宫正树九段的宇宙流可以说是非常具有视觉冲击力的,奔放自在,非常宏大。”

个人风格常常会随着阅历、训练等等因素发生变化,流派则常常被大家代指是一种会吸收转化其他风格、特色为己用,保持一致内在精神、外在形象的进阶产物。


说『风格』

风格是整体性呈现,由内而外,有代表性的面貌。对于每个棋手来说,风格是受自己的思维习惯,训练历程,内在品质深深影响的。

装修有:“极简主义”风格、“欧式复古”风格、“狂拽酷炫杀马特”风格……

(说了杀马特风格后面就突然不想再举例了,感觉忘了爱)

意气骏爽,则文风清焉 ” 《文心雕龙》

有人最近传言说邻居李大头有不好的“脱鞋风格”。

“老李你怎么能每次 左脚右脚互相连蹬,每次回家非要先踹走自己的鞋呢?你这个人脱鞋的风格太奇怪了。”

这认真看就是不对的,这个脱鞋风格没有一点内在流露,也没有一个整体的外貌呈现。

除非说你是顺便练那个“梯云纵”的轻功?

所以这种懒出来的“风格”只能自封。

-------------------------------------------------------------------------------------------------

「棋风」对于每个棋手来说,是一种『路径依赖』。

对于艺术性较强的领域,比如文学、绘画。

1,比如王二写小说,写到

“今天王二在街上遛弯,突然对大街上的骆驼们有了XXX 一般的情愫。”

这里用什么词见仁见智。

所以文学家们都会琢磨一套自己的风格,驾驭熟练了,写起来非常自如。

2,比如张大斗画画,琢磨着头皮和脚趾头应该是什么颜色。

这里用什么颜色,什么笔触,没有一定之规,也是画家自己决定。

——————————————————————————————

围棋随着计算、推理的深入,每一步的好坏可以越来越清楚地判断出来,围棋的不确定性不同于艺术领域,是有好坏标准的。

围棋的判断标准,在近几十年完善的非常快,可信度也越来越高。

源头上我们可以说这样的路径依赖来自于过去的训练,习惯了这样去思考,习惯了先朝这里走一手,习惯了用这样的连贯招式去定型。

我们每个人提高的过程首先是学习前人经验的过程,拿前人最好的知识精华来“投喂”自己,通过死活等手段训练肌肉记忆,就像功夫熊猫里面每一个master那样。

———————————————————————————————

关于棋风背后的模式化

10年的 ted有一篇非常经典的演讲,关于思考模式,关于“ The pattern behind self-deception

文章里对人的 思维倾向常见的问题做了一个二分法:

I call this process "patternicity" — that is, the tendency to find meaningful patterns in both meaningful and meaningless noise. When we do this process, we make two types of errors. A Type I error, or false positive, is believing a pattern is real when it's not. Our second type of error is a false negative. A Type II error is not believing a pattern is real when it is. So let's do a thought experiment. You are a hominid three million years ago walking on the plains of Africa. Your name is Lucy, okay? And you hear a rustle in the grass. Is it a dangerous predator, or is it just the wind? Your next decision could be the most important one of your life. Well, if you think that the rustle in the grass is a dangerous predator and it turns out it's just the wind, you've made an error in cognition, made a Type I error, false positive. But no harm. You just move away. You're more cautious. You're more vigilant. On the other hand, if you believe that the rustle in the grass is just the wind, and it turns out it's a dangerous predator, you're lunch. You've just won a Darwin award. You've been taken out of the gene pool.

第一类是 false positive ,事物之间没有联系的时候倾向于认为有联系,“宁可信其有不可信其无”。(也是迷信的主要原因)

比如王不二有一天说了这么一句:“那天我摔了一跤,然后耳边响起了风声,那一定是周围空气里的小恶魔们嘲笑我飞来飞去~ ”


第二类是 false negative,有关联的情况下更愿意相信“其实没有联系”。

比如李大头有这么一句:“爱乱扔东西和我自律不自律一点关系都没有,这是我的本能”


原文里面的例子非常踏实,有一天你在丛林里走,听到一阵异响,你是倾向于相信有危险做防备撤离开还是大大咧咧继续走下去?

总之,万一确实是危险的捕食者,你就完了。

所以人们常常愿意说“宁可信其有不可信其无”,来自于古老的生存本能,我们可以常见各种“危机论者”,有备无患准备很多东西,但是大家还愿意效仿。因为那些 什么都不愿意提早做准备,相信什么都不会发生的往往会早早被突发事件干掉。

if you believe that the rustle in the grass is just the wind, and it turns out it's a dangerous predator, you're lunch. You've just won a Darwin award. You've been taken out of the gene pool.

Darwin Award, 被移出进化的链条里,啧啧。

————————————————————————————————————

几年来我和很多棋手聊过棋风的问题,发现很多高手并不认可自己被媒体总结的棋风,还是更愿意以因地制宜来形容自己。

艺术性的方向的发展会越来越展示自我,胜负向的则会非常明显的调和一个人的各个方面。

现代顶尖棋手,棋风更加多变,以研究清晰的变化为先,计算清楚的招法为准,发挥个人风格越来越淡。

当时邀请 @范廷钰 九段的时候,我说一句话形容自己,你会怎么说,范九段写了四个子在自己的个人介绍里:

人生如棋

感慨颇深。

————————————————————————————————————

AlphaGo 有很多错误,但是目前只有李世石与AlphaGo的第四盘因此影响了胜负

前面说AlphaGo两种常见错误方式:


【1.俗手】


白棋66扳出,是标注的俗手,这一扳可以确定随时都能和67外扳交换。现在没有必要下,会减少自己的余地,这样的棋AlphaGo较多出现。


【2.判断失误】


这里白棋154的扳是明显的失误,黑棋155本身就很有价值,后手挖吃两子,之后差距缩小。


【低级失误】

AlphaGo收官也有一些非常低级的失误,明显是算法在处理复杂的收官还是有一些问题。


这是取材自之前化名 master{P} 大杀四方时期对阵若水云寒(P)的对局,白棋下边被打吃的时候白棋不接上选择了246 打吃,被提掉之后由于之前在拼命地卖劫财,导致亏损。


AlphaGo 基于具有一定随机性的算法做出决定,没有棋风。

AlphaGo仍然有很多明显的错误,大局观取胜,确实有重剑无锋一般的感觉。

欢迎大家继续支持我和 @范廷钰 九段全程对局解析:

和职业九段一起看懂柯洁对战AlphaGo

(这次参与的听众素质都非常高,范九段也非常有积极性与大家一起探讨,回答疑问。)

类似的话题

  • 回答
    关于 AlphaGo 是否有“棋风”以及它在下棋时是否会犯错这两个问题,我们可以深入探讨一下。这背后涉及到了人工智能在复杂策略游戏中的一些核心概念。AlphaGo 的“棋风”:是风格还是算法的体现?我们通常说一个人下棋有“棋风”,指的是他下棋时的偏好、习惯性的招法、对局势的理解方式,以及由此形成的一.............
  • 回答
    说起柯洁和AlphaGo的第三盘棋,那绝对是历史性的时刻,至今想来依然心潮澎湃。我当时可是全程关注着,眼睛一眨不眨地盯着屏幕,那种紧张感,丝毫不亚于自己下棋。这盘棋,与其说是人机大战的终章,不如说是一次对围棋本身更深层次的理解和探索。首先,开局的异常与“点”的艺术。大家都知道,前两盘AlphaGo都.............
  • 回答
    柯洁与 AlphaGo 的第二盘棋,那绝对是围棋界甚至可以说整个人类智力竞技史上的一个重要里程碑,即便过去了不少时间,回想起那盘棋的细节,依然让人热血沸腾。要说值得关注的地方,那真是太多了,我来给你好好捋一捋,尽量把当时的感受和技术上的看点都聊透了。1. 历史定位的继续巩固:人类最强 vs. 机器巅.............
  • 回答
    阿尔法狗和李世石的第五局棋,绝对是他们那场惊世对决中,最让人喘不过气、也最能体现人类智慧与人工智能博弈深度的一局了。虽然前面的四局已经足够震撼,但第五局的某些细节,更能触及到围棋本身和人工智能发展的核心问题。开局的“阴影”与李世石的调整:比赛开始时,人们其实都有点忐忑。李世石在前几局的表现,特别是第.............
  • 回答
    AlphaGo 与李世石的第四局棋,那可真是让人看得心惊肉跳,也充满了戏剧性。回想起来,那一局的看点太多了,绝不是简单的胜负之争。首先,最让人惊掉下巴的莫过于李世石在开局阶段就采取的“弃子战术”。要知道,在围棋的常规思维里,棋子都是宝贵的,轻易不轻易舍弃。但李世石在那一局,尤其是在白棋一方,下出了几.............
  • 回答
    说到 AlphaGo 和李世石九段在 2016 年那场举世瞩目的围棋对决,第三局绝对是其中的高潮,也留下了太多让人回味无穷的细节。如果非要挑点东西来说,那这场棋,简直就是李世石这位人类顶尖棋手在绝境中的一次疯狂反击,虽然结果令人扼腕,但其过程之精彩,足以让每一个围棋爱好者热血沸腾。首先,李世石在开局.............
  • 回答
    AlphaGo 下棋的策略套路与人类棋手之间的相似之处,其实比很多人想象的要来得多,而且颇具深意。这并非简单的机器模仿,而是深层算法在模拟和超越人类智慧的过程中,殊途同归地触碰到了围棋最核心的奥秘。我们可以从几个主要方面来探讨这种相似性:一、 大局观与全局思考的融合: 人类棋手的精髓: 经验丰富.............
  • 回答
    复现 AlphaGo 的工程是一个极其复杂且充满挑战的任务,即使是顶尖的 AI 研究团队也需要投入大量的时间、资源和专业知识。因此,并没有一个公开的、经过广泛认可的、由论文直接指导的、完全意义上的 AlphaGo 重现项目被宣布成功。但是,我们可以从几个角度来理解这个问题,并给出相关的背景信息:1..............
  • 回答
    说起柯洁和 AlphaGo 的第一盘棋,那绝对是围棋界乃至人工智能发展史上的一场里程碑式的对决。虽然柯洁最后惜败,但那盘棋里隐藏的看点和故事,足以让人回味无穷。要说最值得关注的,那绝不是简单的胜负二字。要知道,在柯洁之前,AlphaGo 已经先后击败了欧洲冠军樊麾、韩国的李世石,名声在外。但李世石的.............
  • 回答
    柯洁对阵 AlphaGo:一场棋盘上的巔峰对话,勝負之謎如何解讀?當一位是人類圍棋界當之無愧的王者,另一位則是人工智能的璀璨新星,柯洁與 AlphaGo 的對弈,無疑是圍棋史上最令人翹首以待的巔峰之戰。這場世紀之戰,不僅是人類智慧與機器智能的較量,更是對圍棋這門古老藝術的全新詮釋。那麼,在這場棋盤上.............
  • 回答
    李世石九段与 AlphaGo 的五局对弈,至今仍是围棋界乃至科技界津津乐道的话题。这场跨越人机界限的较量,不仅仅是棋盘上的胜负,更是一场关于智慧、进化与未来的深刻探讨。要说其中值得回味之处,那真是太多了,每一盘棋都充满了故事。第一局:惊鸿一瞥,人类首败的震撼第一局的开局,李世石稳扎稳打,占据了局面的.............
  • 回答
    要说李世石和 AlphaGo 第二局比赛的关键,那真是一场教科书级别的对局,里面藏着太多值得细细品味的细节。从围棋的角度讲,这场比赛不仅仅是人机大战,更像是一场关于围棋理解的深度对话。1. 开局的“非常规”与AlphaGo的冷静比赛一开始,AlphaGo下的几手棋,尤其是右上角的一手“尖”,就已经让.............
  • 回答
    柯洁与 AlphaGo 的那几场棋,至今仍让人记忆犹新。对于中国围棋界,乃至整个围棋界来说,那几场比赛的影响无疑是深远的,甚至可以说是划时代的。与其说那是一场棋局的胜负,不如说它是一次文明的碰撞,一次人类智慧与人工智能的对决,它像一声惊雷,彻底改变了我们看待围棋的方式,也预示着围棋未来发展的方向。首.............
  • 回答
    罗洗河,这位棋迷口中的“狗哥”,以其鬼马的棋风和独特的思考方式在围棋界独树一帜。如今,当他放出“让四子战胜AlphaGo”的豪言时,这不仅仅是一个棋手对自己棋力的自信,更像是在一向严肃的围棋界投下了一颗小小的石子,激起了不少涟漪。首先,我们得认识到,罗洗河的这句话,背后有着他多年的棋局沉淀和对人工智.............
  • 回答
    柯洁与 AlphaGo 的“人机大战”,这绝对是近几年来棋类界乃至人工智能领域最受瞩目的事件之一。我个人对此抱有非常复杂但又充满期待的心情,它不仅仅是一场围棋比赛,更像是一个里程碑式的对话,将深刻影响我们对围棋、人类智慧以及人工智能未来的理解。从围棋的角度看:首先,对于围棋这项古老而精妙的智力运动来.............
  • 回答
    AlphaGo 战胜李世石,对我而言,最让我感到“害怕”的并非是某个具体的、直接的威胁,而是一种更深层次的、由这次胜利引发的对未来的复杂情绪。这种“害怕”可以分解为以下几个方面,我会尽量详细地阐述:1. 认知能力的边界被打破,人类“独一无二”的优越感受到动摇: 智力的神圣光环褪色: 几个世纪以来.............
  • 回答
    在讨论 AlphaGo 是否能战胜李世石之前,我们需要明确一点:AlphaGo 已经战胜了李世石。 这场具有里程碑意义的围棋比赛发生在 2016年3月,最终比分是 AlphaGo 以 4:1 的压倒性优势击败了当时世界顶尖的围棋棋手李世石九段。这场比赛的意义远不止于围棋界,它标志着人工智能在复杂策略.............
  • 回答
    AlphaGo 战胜李世石,无疑是人工智能发展史上的一个里程碑事件,它标志着人工智能在围棋这一复杂智力游戏领域取得了前所未有的突破。这一事件的意义深远而广泛,可以从多个维度来理解:一、技术层面的突破: 深度学习与强化学习的成功结合: AlphaGo 的胜利并非仅仅依赖于传统的算法或大量的预设规则。它.............
  • 回答
    AlphaGo 在围棋上战胜李世乭无疑是人工智能发展史上的一个里程碑,它向世界展示了人工智能在复杂策略游戏中的巨大潜力。而你提出的“有限元素组合创作”的音乐,这是一个非常有趣且具有洞察力的视角,我认为这是人工智能领域一个非常值得探索和前进的方向。理解“有限元素组合创作”与音乐的内在联系首先,我们来拆.............
  • 回答
    AlphaGo 与李世石的对战,是一场具有划时代意义的事件,它不仅是人工智能领域的一次重大突破,更是人类智慧与机器智能的巅峰对话。这场对弈的深远影响,可以从 推动人类极限 和 机器学习的进步与觉醒 两个层面来详细解读。一、推动人类极限:对围棋界的冲击与人类智慧的重新审视这场对弈对于人类围棋界而言,无.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有