如何用人工智能AI来学习围棋？第1页

qi-lue-yan-jiu-suo 网友的相关建议:

2015年12月，世界棋坛发生了一件大事：柯洁先在三星杯决赛中2：0战胜时越，又在梦百合杯决赛3：2战胜李世石，成为公认的世界第一人。

从2011年到2015年，棋坛处于“一冠群”的群雄割据时代。柯洁突破一冠群不到一个月，就马上拿到第三冠，第二年更是再接再厉，彻底拉开了和其他年轻棋手的差距。

在此之前，中韩棋坛大部分棋手都认为时越是当时的世界最强。所以三星杯决赛对阵时越，也是柯洁成为世界第一的关键一战。

作为时越的多年忠实粉丝，笔者当年认真观看了比赛。如今有了AI的帮助，笔者重新复盘，发现了很多过去不曾知道的内容。

比如，在今天要说的决赛第一局中，AI的搜根术令笔者大为惊叹，学到了很多东西。

这盘棋柯洁执黑，时越执白，双方长期处于相持状态，大半盘的时间里，谁也未能拉开差距。

（以下的AI胜率均由星阵给出，由于比三星杯使用的贴目制少贴1目，黑棋实际胜率会比给出数据稍高，故而应结合目数差距进行参考）

棋局进行到黑41打入，白棋应该如何应对呢？封锁，还是搜根？

此时白棋胜率62.5%。在这里，白棋可能错过了一次极好的机会。

此时，AI强调白1的二路托，以下威胁黑棋眼位的同时，也加强自身的眼位。黑10出头之后，白11回手再搜左上打入黑子的根。

以上就是AI选择白1托的推荐变化，白棋胜率将为63.6%。

实战时越选择了封锁，白42压住以后，白46再来搜根，已经晚了一步。

在白42时，AI推荐的所有选点，全是以搜根为思路，根本没有实战白42封锁的推荐。白棋在这里的思路，可能在方向上错了。

局部下到白58断、黑59吃住告一段落。黑棋在白棋的大本营中，舒舒服服地活出了一大块，白棋胜率暴跌至37.8%。

白棋打入上边，双方经过几个回合的交换后，又回到左边进行定型。

白68打时，AI认为黑69应该在A位先扳一手（只扳不粘）。

这里是个伏笔，接下来的很长时间里，A位都是AI心心念念的双方要点。

黑71扳起时，AI认为白72应该脱先，于上方A位搜根。

白棋错过搜上边黑棋的根的机会，黑77终于抢到先手，补住了上边。

然而，此时白棋又有了搜左边黑棋根的机会。此时白棋胜率45.0%。

面对黑77，白78缓了！白棋胜率瞬间暴跌10%。

猜到AI推荐了吗？没错，白棋应该在A位立下，搜左边黑棋的根。而白棋错过机会之后，黑棋也应该抢A位的扳。

然而，双方这时可能都对A位的重要性重视不足。

几个回合后，白棋在右上角占了便宜，又抢到先手，白96终于回手抢到了要点。

这几个回合里，AI几乎在双方的每一步都会推荐左上96的要点，双方就是不抢，AI估计也是吐血不止。

白棋抢到要点，胜率升至68.0%。

可是，笔者心中有个疑问：为什么这个二路立或者二路扳，如此重要呢？

借助AI的推荐变化，笔者大致琢磨出了白棋的意图：

白1刺永远都是先手。在左上二路立之后，黑棋边上实际上就只有一只眼了。如果将来出头不畅，就必须在A位团，单官补活，这显然毫无效率。

所以左上二路的白棋立或黑棋扳，虽然并非直接决定死活，却也能显著地影响到左边黑棋的安危。

要知道，下边黑棋也没活干净。黑棋如果两块不活，一个不小心就是被缠绕攻击的命运。

黑棋将左边两块棋连了起来，而下边白棋又经历了打劫活。

白146消劫、黑147长之后，白棋胜率为46.2%，接下来的焦点转移到了右边白棋身上。

黑147长就是为了向右边白棋施加压力，那么白棋该如何补棋呢？

AI推荐白1尖，白棋胜率49.1%。

这么下看似不紧凑，还留下了二路点的官子，但实际却是无可奈何的选择，因为......

实战白150贴住，本是第一感，为什么AI不推荐呢？

白棋这么下，胜率降至42.4%，因为黑棋将会有A位的二路透点！又是搜根！

AI推荐变化如上图：黑1透点之后，白2挡住，黑3二路夹是定式化的手法。占够便宜之后，黑7、9再威胁上边白棋，同时补强自己，如此黑棋不错。

至此，AI已经推荐了白棋对下边黑棋、上边黑棋以及左边黑棋的搜根，推荐了黑棋对右边白棋的搜根，各种朴实而又严厉的二路手段令人印象深刻。

欣赏完AI的搜根术，我们也看一下这盘棋的胜负关键处吧，回顾一下时哥是怎么输的棋。

黑187长，此时白188跳是败着，当年的解说说，时越出现了误算。白棋应该在A位粘住，如此有83.7%的胜率（实际胜率稍低，目数上可能只好半目）。

但白188以为有白B的出动，黑棋必须补棋，这却是看错了。

如果白1粘住，AI的推荐变化如上图。白3、5补棋之后，中央肯定能成一些空，黑棋破不干净。

如此一来，很可能是白棋半目优势的局面。

柯洁应该是发现了问题，黑189、191毫不理睬，直接将白棋中空破光。时越这时也没有别的选择了，白192出动，图穷匕见！

这里的关键是，白棋能不能吃住黑棋呢？时越是出现了什么误算呢？

实战，黑195顶的时候，我们发现白棋竟然不能在A位紧气，只能在196粘住。松了这一口气，白棋已经失败了。

白棋本来的计算应该是这样的：白1紧气，以下白3、5、7一路追击，白9打吃，这里是劫吗？不是的......

黑10提之后，白11粘住，白13可以从后面吃一个接不归，黑棋崩盘。

这不是挺好的吗？哪里出现了问题呢？

白1紧气实际是不行的，因为黑2可以扳上来，弃子转换。

如果白3吃住黑棋五子，黑4反打、黑6粘住，我们发现右上白棋全死了！这肯定不行，得不偿失。

所以，如果白1紧气，黑2扳，白棋顾不上吃黑子，只能白3夹，抢救上边白棋。

可是这样一来，黑4打先手，黑6、8、10一路连回家，反而把白棋中央全部吃掉了。

过程中，白5在10位鼓劫也是不行的，黑棋先手提劫后将万劫不应。

因为以上的变化，所以白196只能粘住，如此才能同时抢救右上和中央。

然而松了一气，无论如何也吃不住黑棋了。黑201回手吃两子，白棋还得再后手补棋。

下到这里，白棋就不行了。虽然差距很小，但白棋小败的结局基本无法避免了。

这盘棋哪怕放在今天，以AI的眼光来看，也是相当精彩的高水平发挥，双方大部分时间在半目胜负上下徘徊。

然而，AI对于几次搜根的强调，对威胁边上孤棋的强调，令人印象深刻。笔者认为，在AI的复盘中，这是最值得我们学习借鉴的地方。柯洁小胜之后，比分变成1：0，时越已经站在了悬崖边上。

那么，第二局又是怎样的呢？柯洁是如何赢下这踏上世界第一的关键一局呢？我们下次再说。

hu-yao-yu 网友的相关建议:

之前我在自己的公众号中，详细聊了李昌镐在1996年东洋证券杯决赛五番胜负第一局中的白88这步意境深远的棋。

白88这招棋可以说是重剑无锋。

大家对此特别关心一个问题：

“AI如何看待李昌镐白88这步棋？”

这个问题很有意思，正好我一直想跟大家聊聊关于如何看待AI的意见这个话题，所以今天就着大家这个提问，跟大家一起讨论一下。

在讨论之前，我先抛两个问题出来：

1：如果李昌镐白88这步棋不在AI的考虑范围内，那这步棋就一定是问题手吗？

2：如果AI给李昌镐白88这步棋降了胜率，那就代表李昌镐在这盘棋中的胜算变小了吗？

这两个问题其实可以合成一个大问题：

AI给出的意见，就一定是好的吗？

下面我们先来看看AI是如何看待李昌镐白88这步棋的：

图1：我们先回顾一下李昌镐白88下在了哪里？

白88下在了上面的一路立，这步棋看着很慢，其实意境深远。

关于这步棋的故事，我之前已经说了，这里就不多讲了。

我在写李昌镐白88这步棋之前，就看过星阵的建议，白88这步棋不在星阵的选择范围内。

而星阵的首选，也就是它推荐的一手棋是：

图2：我估计李昌镐若在当时看到星阵白1这步推荐，应该会吓一大跳。

这是孤身单挑黑三角六子的节奏。

的确，别说是李昌镐这样谨慎的棋风，就是剑法最霸道的申真谞来了，估计也不会去动黑三角六子的脑筋。

当然星阵有它的理由，它显然不认为你黑棋三角六子很强，它要来攻击黑三角六子。

那么星阵推荐的这步棋就一定适合李昌镐来下吗？

下面我就以虚构的形式，来跟大家推演一下，如果李昌镐采取了星阵的推荐，会发生什么情况：（以下内容纯属虚构）

图3：李昌镐正准备下白88（白A），心里想着：“这步棋虽然实地价值小了，但是可使白三角大块彻底净活，而黑三角大块则没有安定。关键这样简化了局势，接下来慢慢小刀割肉。这种局面是我最擅长的。”

正当李昌镐要落下白88时，星阵突然出现，悄悄跟李昌镐说：“我觉得白1这步棋胜率最高，我推荐白1这步棋。”

李昌镐一看白1这步棋，心想：“白1这步棋不像是优势情况下的招，倒像是形势不利下的胜负手，可这时候明明是白棋形势好，这步棋靠谱吗？

但星阵实力那么强，它推荐的招，总不会错吧。”

于是李昌镐就改变原计划，采取了星阵的意见，下出了白1这步棋。

而此时李昌镐的对手，正处于劣势下的马晓春，正愁全盘找不到敌人可以搞乱局面。突然发现李昌镐白1自己找来了，心中大喜：“此时不反击，更待何时！”

于是黑2反包围白1一子是必然的选择。

那么接下来白棋该如何处理呢？

图4：白1靠，利用黑三角孤单一子做文章，是星阵的后续手段。

李昌镐下出此手后，马晓春黑2长也是必然，不然在A的位扳的话，白棋在黑2位一虎，黑棋形有问题。

当黑4压的时候，星阵选择了白5、7顶断后，白9长出。

这下有意思了，原本是奔着收官格局去的局面，突然变成了乱战的格局：

图5：当前局势，处于完全混战的局面。

黑棋左边三角大块、上方圆圈大块、中央方块四子均没安定。

而白上方三角大块、中央圆圈两子、包括左下白方块四子也有隐患。

因此马晓春肯定要黑1飞，先把左边黑三角大块和上方黑圆圈大块连络再说，顺便也起到了分断白圆圈两子和上方白三角大块的作用。

虽然黑自身还留有白A位靠的手段，并未完全连络，但是白棋左下也欠着黑B位扳的手段：

图6：黑1飞的时候，假设白2跳一个，那么左下黑3、5扳了一虎后，白棋若防A位的断点，黑B位扳下后，原本与世无争的白三角一子也被分断加入了战团。

整个局面就一个字：“乱”

图7：所以当马晓春黑1飞的时候，李昌镐是已经彻底晕菜了：“本来可稳稳拿下的棋局，怎么现在头绪越来越多，完全看不清了。”

而马晓春此时则越战越兴奋，士气大振。毕竟在劣势下，能争取到与对手有50%概率一赌生死的机会，那是多么幸福的事情。

此刻的李昌镐，不知路在何方，只好继续求助星阵。

星阵当然有招，对于它来说，这怎么会是五五开的战斗呢？这明明就是八二开的战斗。

不过星阵也是悄悄来到李昌镐身边，不易停留太久，于是准备撤退。

而且星阵觉得：“我都给你教到这里了，剩下的就好办了，你自己来就可以。”

李昌镐这下傻了：“让我自己来？你把我领到最复杂的时候，你让我自己来？”

李昌镐本来就不擅长这种几块棋乱战的局面，再加上他原本就是优势的一方，此时出现这样的乱局，他的心态也难免受到波动。

而马晓春本来在劣势下正愁找不到头绪，现在出现五五开的战斗乱局，那简直是白来的，那他肯定是越战越勇，哪招最狠就来哪招。反正本来就是输面大的棋，杀输了也没啥，但要是杀赢了那就赚了。

之后的情形可以想象，李昌镐在大概率上会遭到马晓春的逆转。

虽然星阵还是没有想明白：“这变化不是很简单吗？我都算了几百万个变化，肯定没有问题的。为什么李昌镐被逆转了？”

星阵同学，你可能忽略了一个问题：

“李昌镐虽然是绝顶高手，但他毕竟还是个人，而你是AI，你俩的计算资源差了好几个量级好不好。”

那么关于星阵为何觉得白棋可战，这其中涉及的变化就太多了，估计我自己都要先在棋盘上研究一天，都还未必能搞清楚。所以就不在这里跟大家聊了。

好了，以上这个虚构的科幻故事讲完了。从中我们可以看到两个关键问题：

1：我们和AI之间有个不对等的地方，那就是计算资源。它一秒钟可以计算许许多多的变化，我们可能只能计算一个变化。
比如AI觉得白棋完全可战的时候，李昌镐可能已经一脸懵了。

2：AI与我们之间也有个不对等的地方，那就是人性。是人就有情绪、有欲望、有心理波动，有自己的长处和弱点。而AI的计算里，并没有把这些变数给算进去。
比如李昌镐发现原本可简明优势的棋，突然变成五五开的乱战局面时，他的情绪会出现负面的波动，而这又是他不擅长的格局；而劣势下马晓春此时一看有命可搏，则士气大振。这些看似无形的因素，是会对最后的胜负产生很大的影响。

所以李昌镐白88下立，虽然在AI眼中，不是一步正解。

但它在1996年，也就是24年前的那个时代背景下，这步棋就是通往胜利之路最快捷也是最简洁的一手。

因为那个时代的李昌镐，有一个很大的特点就是不动如山。他能控制住自己的贪欲，尽量把棋局导向他能掌控的局面，哪怕最后仅仅只是小胜。

因此从技术的角度来看，这步棋安定了白三角大块，使得黑三角大块更为不安定。从而消除了局面的变数。接下来的一切都在李昌镐的能力精算范围之内。

而从心理的角度来看，此手下完后，李昌镐的心态愈加笃定，而他的对手马晓春则在劣势下一时找不到敌人，心理越发着急，结果很可能露出破绽被李昌镐扩大领先优势。

而AI推荐的A位这步棋，也许相比李昌镐白88来说，离围棋上帝眼中的“正解”更近，但问题是，这招棋未必适合人类棋手；更不适合李昌镐这样的棋风。

这招棋从技术的角度来看，它使得原本风平浪静的局面突起波澜，搞得好几块棋都加入了战团，那么这种局面对于人类棋手来说，已经超出了他们的精算范围之内，后面的胜负，将完全听天由命了。那么这对于执白优势一方来说，这个策略无疑是不合理的。

那么从心理的角度来看，这招棋一下，使得原本处于优势情况下的白棋变成了五五开的乱战格局，那么李昌镐心里就会开始发虚，而马晓春则光脚不怕穿鞋的，求之不得。这样一来，率先露出破绽的很可能就变成李昌镐了。

所以我们现在回头再来看，假设李昌镐白88下完后胜率是70%，而星阵推荐的这步A位下完后，胜率达到了90%。

那么对于星阵来说，白88无遗是降了胜率；可对于李昌镐来说，若是下了A位，倒反而是降了胜率。

那么到底谁对谁错呢？

谁都对，只是他们本就有不同之处罢了。

原因还是那两点：

1：人类棋手没有AI强大的计算资源

2：AI不了解人类棋手的心理变化

最后我再聊聊这两点：

第一个问题：由于人类棋手没有AI强大的计算资源，因此很多时候，AI觉得没问题的路，只是因为它掌握了越过这条路的路径和方式。但这未必适合于你，也许你选了这条路后，你就掉坑里去了。

这就好比是小马过河的故事，大象觉得这条河很浅，可小松鼠若听了大象的话直接就上了，那它一下水，就会发现，这水太深了。

所以到底这条河的深浅如何？小马还需要结合自身的情况和特点来独立判断。

第二个问题：AI所计算出来的结果，并没有把人类的情绪和心理波动、以及其自身的性格特点而导致的非理性行为给计算进去。

举个例子，AI通过超强的计算力，可以计算出股票市场的大致走向，但这是建立在“人们都是在理性的投资”这个前提下。可事实上，这个前提存在吗？一个涨停板，我们的心跳加速起来；一个跌停板，整个人又都不好了。市场上一个风吹草动，就会给市场造成极大的波动。这些人性的特点所带来的变量，并不在AI的计算范围内。

所以AI的建议，只是在它的计算能力范围内，以及去除了人这个复杂变量的前提下，所得出的最佳答案；可对于我们人类而言，这个答案到底适不适合我们拿来用，这还需要有一个自己的判断和筛选。

我有时会看到这样的话：

“你看，以前大家认为某某某很牛的一步棋，现在拿AI来看，也不过如此嘛。”

怎么个不过如此？这不是简单放个胜率就可以定案的。

若要想定案，至少需要有以下几点说明才是：

首先，你需要说明AI给出的意见，其背后的用意是什么？同时解释一下它这步棋比对局者当下这步棋好在哪里？比如AI白1这步棋是想冲击黑左下六子，它认为黑左下六子并不厚，如果能冲击到，那么李昌镐白88就成了缓手。

然后，你还需给出自己的判断，就AI这步棋虽然好，但到底适不适合我们使用？比如白1冲击完所引发的战斗，是否在人类的计算范围内能看出白棋的确明显可战，要是大家一看，这不是五五开的战斗吗？那就要掂量一下，这是否适合我们使用，尤其还是在局面优势的情况下。

接着，如果AI推荐的这步棋，的确适合人类棋手使用，那么是否适合当下对局者的棋风特点？比如李昌镐明明是不动如山的风格，你偏要他跑到左下去挑衅黑棋，关键这个战斗获胜的概率也就60%，那你很可能就是坑他了。

再接着，你还需要考虑到两位对局者在当前局势下，所处的心理状态又是什么样的？明明一方处于穿鞋的状态，另一方处于光脚的状态，你说AI认为他应该下得更积极些。但问题是，AI没有风险这个概念，但人面对风险时，心态是会有波动的。

最后，若是评价历史棋局，则要回到那个当下的时代背景去理解对局者的招法。

比如常昊和崔哲瀚那次应氏杯决赛第三局，也许常昊那步白92脱先并非最佳之手，但这步棋对于常昊来说，就是在精神上突破自我的一手，就是因为他具备了下出这步棋的勇气，所以才能凤凰涅槃。

所以，解释AI的意见，不是那么好说的，起码不是随便一句：“这步棋不是AI推荐的或者降胜率了，所以差评。” 就能搞定的。

AI的胜率之下，有着人类无法企及的计算资源，所以我们要对AI的意见持有自己的主见和判断，不然AI是没事，但你却很可能掉坑里去了。

AI的胜率之上，则有它无法预测的人心。人，这个复杂的变量，本就是围棋的重要组成部分。

两位对局者在棋盘前，不仅要比拼技术的高下，同时也在进行心理上的博弈。

所以只要还是人和人在对弈，那么围棋的乐趣就永不变。

如何用人工智能AI来学习围棋？的其他答案点击这里

如何用人工智能AI来学习围棋？第1页

相关话题

前一个讨论

下一个讨论

相关的话题

如何用人工智能AI来学习围棋？ 第1页

相关话题

前一个讨论

下一个讨论

相关的话题

如何用人工智能AI来学习围棋？第1页