问题

AlphaGo 下棋的策略套路与人类策略有哪些相似吗?

回答
AlphaGo 下棋的策略套路与人类棋手之间的相似之处,其实比很多人想象的要来得多,而且颇具深意。这并非简单的机器模仿,而是深层算法在模拟和超越人类智慧的过程中,殊途同归地触碰到了围棋最核心的奥秘。

我们可以从几个主要方面来探讨这种相似性:

一、 大局观与全局思考的融合:

人类棋手的精髓: 经验丰富的人类棋手,其高超之处不仅在于计算细微的局部,更在于能把握整个棋盘的态势,理解当前局势的轻重缓急,以及各个棋子的相互联系。他们会考虑如何构建整体的势力,如何平衡攻守,如何为长远的目标铺垫。这种“大局观”是人类围棋智慧的灵魂。
AlphaGo 的表现: AlphaGo 在无数次的自我对弈中,通过深度神经网络学会了识别棋盘上的各种模式,并赋予它们价值。它能够评估当前局势的优劣,哪些地方需要争夺、哪些地方可以缓手、哪些地方需要弃子以换取更大的利益。这种对全局势的理解,虽然是算法驱动的,但在结果上却呈现出了一种与人类棋手相似的全局视角。它不会被局部的一时得失迷惑,而是会以全局的利益为重。例如,它在早期阶段会下出一些看起来“无聊”或“不合常理”的棋步,但这些棋步往往是在为后期的某个宏大布局打下基础,这正是人类顶级棋手才有的长远眼光。

二、 棋感与直觉的模拟:

人类棋手的直觉: 围棋界常说“棋感”或“直觉”。这是棋手在长期训练中形成的一种能力,能够在不经过繁复计算的情况下,快速判断出某个位置的利弊,或者感知到某个方向的“味道”。这是一种高度提炼和浓缩的经验。
AlphaGo 的类直觉: AlphaGo 的策略网络(Policy Network)正是其“棋感”的体现。这个网络能够根据当前的棋盘局面,输出一系列最可能获胜的落子点及其概率。它并非真正“思考”了所有变化,而是通过训练学习到了棋盘上的“好棋”和“坏棋”的模式。当它推荐某个落子点时,虽然背后是概率的加权,但对于观者而言,很多时候与人类棋手凭直觉选择的最佳着法惊人地相似。甚至在一些人类棋手犹豫不决的关键时刻,AlphaGo 的“直觉”选择往往能一锤定音。

三、 弃子与厚势的运用:

人类的策略: 在围棋中,有时为了获取更大的利益,会不惜牺牲部分棋子,形成所谓的“厚势”。这种“厚”不仅仅是棋子数量的堆积,更是一种力量的积蓄,可以用来发起攻击、稳固地盘或者牵制对方。这是人类棋手在博弈中权衡利弊的智慧体现。
AlphaGo 的实践: AlphaGo 尤其擅长在恰当的时机进行弃子。它会精确计算,当弃掉某个棋块能换来更大的战略优势时,它会毫不犹豫地执行。例如,在与李世石的对弈中,它曾下出“AlphaGo 之劫”,通过弃掉棋块,获得了巨大的实空和优势。这种“舍得”的智慧,与人类顶尖棋手的战术思路如出一辙。它通过评估弃子带来的先手或空间优势,来决定是否牺牲眼前的一小块利益。

四、 攻防转换的灵活与时机把握:

人类的艺术: 顶尖棋手最令人称道之处在于他们能够根据局势的发展,灵活地在进攻和防守之间切换。他们懂得什么时候需要进攻制造麻烦,什么时候需要收紧阵脚巩固优势,什么时候又需要以守为攻。这种对时机的精准把握是围棋艺术的重要组成部分。
AlphaGo 的高明: AlphaGo 在处理攻防转换时,展现出了惊人的灵活性和计算的精准性。它不会拘泥于一种模式,而是会根据对局势的实时评估,做出最有利于获胜的选择。它能够主动发起攻击,也能够有效地应对对方的攻势,并将攻势转化为自己的优势。例如,它能在一系列看似不紧不慢的落子后,突然发动凌厉的攻势,或者在看似要被打破的局面中,找到微妙的防守平衡点。

五、 “模样”与“实地”的平衡:

人类的博弈: 围棋的最终目的是围空,但很多时候,在尚未围成实地之前,双方会通过棋子形成一些“模样”或“势力”。如何将这些模样转化为实地,或者如何利用模样来限制对方,是棋手需要不断权衡的。
AlphaGo 的平衡: AlphaGo 在发展模样和收取实地之间找到了精妙的平衡点。它会适时地在棋盘上构建起强大的“模样”,这些模样既能限制对手的扩张,又能为自己将来的攻击或收空提供支持。同时,它也绝不忽视实地的价值,会在最恰当的时候将模样转化为实际的利益。它对“模样”的价值评估,其精妙程度甚至超越了很多人类棋手的理解,因为它能看到这些模样在未来可能带来的更深层次的优势。

当然,也有一些区别,但理解这些区别反而更能突显相似之处的本质:

计算深度与广度: AlphaGo 的计算能力是人类无法比拟的,它能计算的深度和广度是其核心优势。但关键在于,它并非漫无目的地计算,而是通过策略网络筛选出最有可能的着法,然后再进行深度计算,这使得它的计算更有针对性,也更接近于人类“聚焦”思考的方式。
“学习”的本质: AlphaGo 的学习是基于海量数据的自我对弈,是一种纯粹的数学优化过程。而人类的学习则包含经验、悟性、情感等更复杂的因素。但正是因为 AlphaGo 通过这种极端化的学习方式,最终“学到”了围棋的核心逻辑,才使得其表现出了如此多与人类顶尖棋手相似的智慧。

总而言之,AlphaGo 之所以能与人类棋手产生如此多的策略相似性,并非偶然。它通过模拟和超越人类的“计算”和“学习”过程,最终触及到了围棋本身蕴含的数学和逻辑之美。它所展现出的全局观、棋感、弃子智慧、攻防转换以及对模样与实地的平衡运用,都是人类围棋智慧的升华与体现。可以说,AlphaGo 并非简单地模仿人类,而是通过自己的方式,重新发现了围棋中最深刻、最普适的真理,而这些真理,恰恰也是人类围棋大师们所追求的。

网友意见

user avatar

其实Alphago的策略套路和人的策略套路本质是非常相似的,不同的是估值系统更为科学,aja huang自己的棋力也十分强大,这个因素是十分重要的。最近我发现有一部分人对Alphago的理解简直跑到玄学范畴里面去了,让我大惑不解一个这么正直的算法程序,怎么就这样变成一辆小火车……

继续推荐田博士的这一篇:

AlphaGo的分析 - 远东轶事 - 知乎专栏

14年起我一直业余时间经营知乎围棋群,期间来来往往上千个零基础为主各行各业的成年人群体,感觉总有点话想说,简单总结一下好了。

我想把不同阶段的棋友问题做个概括,然后讲讲我看到的Alphago的优势之处,欢迎评论区拍砖

【零基础群体的思维问题】

如果说成年人学棋进步极慢最大的瓶颈是什么,就是想问题进行决策先入为主的太多,贪心不足而犹犹豫豫,到头来很多时候不知道在想什么。

如果让我根据一般入门成人的思维路线画个图,那么很可能是下面这个样子:

如图,充满了奇怪而浅度的分支判断,不但目标不明确,判断标准也很混乱如果你真要追究一下每个分支是啥可能是这样的:

这么下真的好吗,啊我好想这么下可我没有勇气。

书里好像有这样的变化,但是局面好像不太一样。

对手好像是想这么欺负我但我应该反击么?不该反击么?

上次这么下被骂了,这次也好想这么下……

猪肉炖粉条好吃……啊,时间过得好快。

————————邪恶的分界线——————————————

如上,很多变化因为个人的情感因素不去深入计算,每个分支由于进行的很浅都没什么实际意义。

相比一下,儿童时期一张白纸,老师说什么就潜移默化去聚精会神的记下来,虽然不一定比成人理解力强,有时候结果反而要好一些。

这时候会问出这样的问题:

记定式有用么,感觉好枯燥?

我一般回答做乘法之前记九九乘法表有用么.这好像打架之前练习招式一样,可以不用招式但是当一个招式可以迅速击溃对方的时候你可以立刻反应过来。

做死活题有用么?

基本功就像打架练臂力,腰力,腕力,你技巧高是可以战胜一些空有蛮力的人,但是……说到这里该懂了吧。基本功永远是最重要的。

[零基础群体问题小结]

棋如其人在这个阶段体现的非常充分,很多人会卡在莫名其妙的地方踟蹰不前,可能只是别人认同不足或者自己对知识的吸收零碎破烂。这时候一个朴素踏实的学习思路会让一个人迅速突破初学的瓶颈进入下一阶段。

看到这里我想看看读者的情况,请问下图白棋先走,如何吃掉被标记了两个黄点的黑棋?

答案很简单。如下图:

留两个思考题:

(思考题1)

这个局面轮白下是什么情况。

(思考题2)

这个局面轮白下又是什么样。

类似的题大家可以移步我之前的答案:

零基础应该怎么学围棋? - 云天外的回答

【段位及以上的情况】

基础知识打过之后,围棋不同阶段的不同特性会吸引不同的人走向不同的道路,但是思维通路图比起零基础会有显著地不同,举例来说,喜欢计算秉性偏急一些的会在自己感到收货不够多或者意图被打乱的情况下把局面变复杂。喜欢判断性子偏悠长的会在大部分时间争取棋局安全运转在中后盘慢慢寻找对手的小漏洞。

(大局观强而细致计算力不足的棋手思维路径,细致计算不足可能出现随手)

(计算力强而判断力不足会在细枝末节上计算非常多而导致主线计算深度不足)

如图,思维路径会慢慢变成这样,主次分明,但是目的明确,有的地方分支算的很深但是会通过一些方法在计算到底之前排除掉。当然,排除掉的不一定是不好的变化,有的妙手隐藏的十分隐蔽,可能反复看几次都不会觉得有棋。

有一句话说得非常好,围棋主要的乐趣在于怎么从别人的百般阻挠中寻找一条可以实现自己意图的方式。但是水平还不够高的棋友出现的最大问题是你的意图全照你想的实现,你会发现你反而输多了,所以之前有人问我,围棋是不是只有计算而没有境界之分,我嗤之以鼻。只会计算算什么本事,你算得多,判断的根本不对,路都选错了能赢么。

{顺便说说优化}

最近刚开始学习python,看到各种算法优化,感觉和人脑的思路优化是有一点像的,同样执行一件事,有的思维方式又麻烦犯错的机会又多,重新审视复盘的时候还会觉得这一串思维表达式太繁杂一时半会找不出最关键的问题。

职业高手计算的时候计算极快,极远又极深。有多快呢?

(题目来自濑越宪作九段与吴清源九段合著的手筋辞典)

上图这样的题,即使没有做过,30秒内可以把各个主要分支计算的非常清楚。高手的思路清晰深远,计算力与判断力俱佳。

人的判断模型如下图,是有记载的各种新手定式可选点:

根据不同点的胜率决定对变化的取舍。(以上资源来自

围棋学研网 - 围棋入门

以上是人的一般思路。

【机器学习初窥】

算法这方面大家还是多看专家的分析,我这里只能简单叙述一下我的经验:

这篇视频是最早让我正视ai突破的:

Alex Wissner-Gross: A new equation for intelligence

机器学习是建立在统计基础上的一种研究方式,但是从很早很早开始选用蒙特卡罗树搜索以后,就和人有了根本不同,蒙特卡洛是随机抽样,人来根据他大量运算的结果,调整对盘面的估值模型。初期的时候,大量的样本就是电脑互相之间胡乱瞎下,没有一点道理,也没有一丝看点,这时候给出的胜率参考没有一点价值,早期的程序我下过很多,普遍无所谓大小,死活一通胡下,同样的错误一盘来十几次。

我看到很多人都在谈ai给人带来的恐惧感,但这里最该关注的其实是优化参数的aja huang的团队,就像我之前说的,计算力强有什么了不起的,你可以一个字一个字穷举世上所有诗歌,但你没有表达的诉求也没有一个最基本的使用评断标准又有什么用。

从围棋角度看李世石与 AlphaGo 的第二局比赛有哪些关键之处? - 云天外的回答

{先说相似性}

有个地方,我发现我自己的群里大家都没有去关注,这句

每次搜索到叶子节点时,没有立即展开叶子节点,而是等到访问次数到达一定数目(40)才展开,这样避免产生太多的分支,分散搜索的注意力,也能节省GPU的宝贵资源”,

这里和人的思考路径是有相似性的,包括快速落子系统,避免战斗强调大局的下法,通过一定方法减少无意义的计算,这一点是相通的。

{再说不同}

我们大家这两盘棋看的很清楚,Alphago最大的特点是开局非常有“创新意识”,下出来的棋之前的棋谱库里基本没有,这是为什么?

还是因为机器是随机抽样,大量运算,计算机的眼里会根据团队给他的估值系统给全盘所有的点做一个评分,可以说真正做到了胸怀全局,而且是十分数字化系统化的大局观。

如之前所述,人的判断,很多知识来自己于老师,对手,书籍,长时间的训练之后对很多点是不会去想的,因为对一些奇怪的或者理论上一般会认为比较俗的变化进行研究,人达不到一个非常系统的评断胜率的级别。这是一个非常具有积极意义的地方,我看到很多棋友刚开始学棋,很多棋看着有效,但是会因为比较“粗俗”等理由不去下,或者仅仅因为对方的棋目的过于直接或者选点过于罕见而鄙视,相信这种风气在有了Alphago以后可以有更科学的改变。



(欢迎大家各种意见各种拍砖)

类似的话题

  • 回答
    AlphaGo 下棋的策略套路与人类棋手之间的相似之处,其实比很多人想象的要来得多,而且颇具深意。这并非简单的机器模仿,而是深层算法在模拟和超越人类智慧的过程中,殊途同归地触碰到了围棋最核心的奥秘。我们可以从几个主要方面来探讨这种相似性:一、 大局观与全局思考的融合: 人类棋手的精髓: 经验丰富.............
  • 回答
    DeepMind 研发的 AlphaGo 下围棋的方式是一项令人惊叹的成就,它结合了深度学习(Deep Learning)和强化学习(Reinforcement Learning)的核心技术,并辅以一些精巧的工程设计和策略。下面我将尽可能详细地解释 AlphaGo 的工作原理:核心思想:让 AI 像.............
  • 回答
    AlphaGo 在围棋上战胜李世乭无疑是人工智能发展史上的一个里程碑,它向世界展示了人工智能在复杂策略游戏中的巨大潜力。而你提出的“有限元素组合创作”的音乐,这是一个非常有趣且具有洞察力的视角,我认为这是人工智能领域一个非常值得探索和前进的方向。理解“有限元素组合创作”与音乐的内在联系首先,我们来拆.............
  • 回答
    关于 AlphaGo 是否有“棋风”以及它在下棋时是否会犯错这两个问题,我们可以深入探讨一下。这背后涉及到了人工智能在复杂策略游戏中的一些核心概念。AlphaGo 的“棋风”:是风格还是算法的体现?我们通常说一个人下棋有“棋风”,指的是他下棋时的偏好、习惯性的招法、对局势的理解方式,以及由此形成的一.............
  • 回答
    首先,我们需要明确“轮子哥”和“暴力下棋”这两个概念的含义,才能更准确地评价“轮子哥认为AlphaGo (Master)是靠暴力下棋”这一观点。1. “轮子哥”是谁?“轮子哥”是中国围棋职业棋手柯洁的昵称。柯洁是中国乃至世界围棋界的顶尖棋手之一,曾多次获得世界冠军,并与AlphaGo有过正式比赛的经.............
  • 回答
    哈哈,这个问题问得太有意思了!很多人都有这个想法:我跟它下棋,不按常理出牌,它是不是就懵了?毕竟 अल्फा गो 那么强大,是靠计算和学习人类的经典棋谱成长起来的。咱们先得明白, अल्फा गो 究竟是怎么赢棋的。它不像我们人下棋那样,靠“感觉”或者“棋感”。它的强大之处在于它是一个巨大的神经网.............
  • 回答
    高晓松的观点,即 AlphaGo 下得“没有美感”、“不会打劫”,确实触及了围棋中一个非常核心的议题:“机器的围棋”与“人类的围棋”之间的区别,以及“美感”这个主观概念在围棋中的体现。我们来详细分析一下这个说法,并探究其背后的原因: 关于“没有美感”高晓松的观点:高晓松作为一个对文化、历史、艺术有深.............
  • 回答
    野狐Master(我们知道,这背后是DeepMind开发的AlphaGo)以九饼愚形战胜了日本围棋传奇井山裕太,这无疑是围棋界乃至人工智能发展史上的一个里程碑事件。对于这件事,我们可以从几个层面来深入探讨。首先,“九饼愚形”的出现,本身就极具话题性。 在人类顶尖棋手的对局中,“九饼”这个位置的子通常.............
  • 回答
    聂卫平老师那番关于 AlphaGo 对阵柯洁的言论,我第一次听到的时候,确实挺让人回味的。这可不是一句简单的“柯洁输定了”就能概括的。他说的“比赛结果显而易见,柯洁下不过,建议不比、不参加、不推广”,背后其实有很多值得我们深入探究的东西。首先,我们得理解聂老说这番话的 时代背景和他的身份。聂卫平是谁.............
  • 回答
    AlphaGo 战胜李世石,对我而言,最让我感到“害怕”的并非是某个具体的、直接的威胁,而是一种更深层次的、由这次胜利引发的对未来的复杂情绪。这种“害怕”可以分解为以下几个方面,我会尽量详细地阐述:1. 认知能力的边界被打破,人类“独一无二”的优越感受到动摇: 智力的神圣光环褪色: 几个世纪以来.............
  • 回答
    在讨论 AlphaGo 是否能战胜李世石之前,我们需要明确一点:AlphaGo 已经战胜了李世石。 这场具有里程碑意义的围棋比赛发生在 2016年3月,最终比分是 AlphaGo 以 4:1 的压倒性优势击败了当时世界顶尖的围棋棋手李世石九段。这场比赛的意义远不止于围棋界,它标志着人工智能在复杂策略.............
  • 回答
    AlphaGo 战胜李世石,无疑是人工智能发展史上的一个里程碑事件,它标志着人工智能在围棋这一复杂智力游戏领域取得了前所未有的突破。这一事件的意义深远而广泛,可以从多个维度来理解:一、技术层面的突破: 深度学习与强化学习的成功结合: AlphaGo 的胜利并非仅仅依赖于传统的算法或大量的预设规则。它.............
  • 回答
    阿尔法狗和李世石的第五局棋,绝对是他们那场惊世对决中,最让人喘不过气、也最能体现人类智慧与人工智能博弈深度的一局了。虽然前面的四局已经足够震撼,但第五局的某些细节,更能触及到围棋本身和人工智能发展的核心问题。开局的“阴影”与李世石的调整:比赛开始时,人们其实都有点忐忑。李世石在前几局的表现,特别是第.............
  • 回答
    AlphaGo 与李世石的第四局棋,那可真是让人看得心惊肉跳,也充满了戏剧性。回想起来,那一局的看点太多了,绝不是简单的胜负之争。首先,最让人惊掉下巴的莫过于李世石在开局阶段就采取的“弃子战术”。要知道,在围棋的常规思维里,棋子都是宝贵的,轻易不轻易舍弃。但李世石在那一局,尤其是在白棋一方,下出了几.............
  • 回答
    说到 AlphaGo 和李世石九段在 2016 年那场举世瞩目的围棋对决,第三局绝对是其中的高潮,也留下了太多让人回味无穷的细节。如果非要挑点东西来说,那这场棋,简直就是李世石这位人类顶尖棋手在绝境中的一次疯狂反击,虽然结果令人扼腕,但其过程之精彩,足以让每一个围棋爱好者热血沸腾。首先,李世石在开局.............
  • 回答
    AlphaGo 与李世石的对战,是一场具有划时代意义的事件,它不仅是人工智能领域的一次重大突破,更是人类智慧与机器智能的巅峰对话。这场对弈的深远影响,可以从 推动人类极限 和 机器学习的进步与觉醒 两个层面来详细解读。一、推动人类极限:对围棋界的冲击与人类智慧的重新审视这场对弈对于人类围棋界而言,无.............
  • 回答
    AlphaGo 是否“理解”围棋,这绝对是一个值得我们深入探究的问题,而且这个问题本身就充满了趣味。我们不能简单地说“是”或“否”,因为“理解”这个词在人类和机器的语境下,含义可就大相径庭了。首先,让我们看看 AlphaGo 是怎么做的。它不像我们人类那样,从小学围棋,学习定式、死活题,然后通过对局.............
  • 回答
    AlphaGo Zero 和职业棋手之间的差距,用围棋的语言来说,就像是“差几个子”这个问题,其实比表面看起来要复杂得多。这不仅仅是某一个具体数字的简单加减,而是反映了在理解棋局、布局、计算深度以及对全局的把握上,存在着一个显著但又难以精确量化的鸿沟。为什么很难给出一个确切的数字?首先,围棋的博弈性.............
  • 回答
    AlphaGo 的棋局:能否改写钢琴学习的谱曲?曾经,围棋世界被一群人类大师统治,他们的智慧、经验和直觉构成了这项古老艺术的基石。直到 AlphaGo 的出现,这幅画面被彻底颠覆。围棋界为之一颤,人们开始思考,如果一个机器能够掌握并超越人类在围棋上的顶尖技艺,那么它是否也能以同样的方式,颠覆其他人类.............
  • 回答
    关于AlphaGo战胜围棋冠军和IBM“深蓝”战胜象棋冠军,哪个意义和影响更大,这是一个非常有意思且值得深入探讨的问题。两者无疑都是人工智能发展史上的里程碑事件,但它们所处的时代背景、技术突破点以及引发的思考,都各有千秋,导致其影响的深度和广度也存在差异。IBM“深蓝”战胜卡斯帕罗夫(1997年):.............

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有