百科问答小站 logo
百科问答小站 font logo



如何用人工智能AI来学习围棋? 第1页

  

user avatar   qi-lue-yan-jiu-suo 网友的相关建议: 
      

2015年12月,世界棋坛发生了一件大事:柯洁先在三星杯决赛中2:0战胜时越,又在梦百合杯决赛3:2战胜李世石,成为公认的世界第一人。

从2011年到2015年,棋坛处于“一冠群”的群雄割据时代。柯洁突破一冠群不到一个月,就马上拿到第三冠,第二年更是再接再厉,彻底拉开了和其他年轻棋手的差距。

在此之前,中韩棋坛大部分棋手都认为时越是当时的世界最强。所以三星杯决赛对阵时越,也是柯洁成为世界第一的关键一战。


作为时越的多年忠实粉丝,笔者当年认真观看了比赛。如今有了AI的帮助,笔者重新复盘,发现了很多过去不曾知道的内容。

比如,在今天要说的决赛第一局中,AI的搜根术令笔者大为惊叹,学到了很多东西。

这盘棋柯洁执黑,时越执白,双方长期处于相持状态,大半盘的时间里,谁也未能拉开差距。

(以下的AI胜率均由星阵给出,由于比三星杯使用的贴目制少贴1目,黑棋实际胜率会比给出数据稍高,故而应结合目数差距进行参考)


棋局进行到黑41打入,白棋应该如何应对呢?封锁,还是搜根?

此时白棋胜率62.5%。在这里,白棋可能错过了一次极好的机会


此时,AI强调白1的二路托,以下威胁黑棋眼位的同时,也加强自身的眼位。黑10出头之后,白11回手再搜左上打入黑子的根。

以上就是AI选择白1托的推荐变化,白棋胜率将为63.6%。


实战时越选择了封锁,白42压住以后,白46再来搜根,已经晚了一步。

在白42时,AI推荐的所有选点,全是以搜根为思路,根本没有实战白42封锁的推荐。白棋在这里的思路,可能在方向上错了。


局部下到白58断、黑59吃住告一段落。黑棋在白棋的大本营中,舒舒服服地活出了一大块,白棋胜率暴跌至37.8%。


白棋打入上边,双方经过几个回合的交换后,又回到左边进行定型。

白68打时,AI认为黑69应该在A位先扳一手(只扳不粘)。

这里是个伏笔,接下来的很长时间里,A位都是AI心心念念的双方要点。


黑71扳起时,AI认为白72应该脱先,于上方A位搜根。


白棋错过搜上边黑棋的根的机会,黑77终于抢到先手,补住了上边。

然而,此时白棋又有了搜左边黑棋根的机会。此时白棋胜率45.0%。


面对黑77,白78缓了!白棋胜率瞬间暴跌10%。

猜到AI推荐了吗?没错,白棋应该在A位立下,搜左边黑棋的根。而白棋错过机会之后,黑棋也应该抢A位的扳

然而,双方这时可能都对A位的重要性重视不足。


几个回合后,白棋在右上角占了便宜,又抢到先手,白96终于回手抢到了要点。

这几个回合里,AI几乎在双方的每一步都会推荐左上96的要点,双方就是不抢,AI估计也是吐血不止。

白棋抢到要点,胜率升至68.0%。

可是,笔者心中有个疑问:为什么这个二路立或者二路扳,如此重要呢?


借助AI的推荐变化,笔者大致琢磨出了白棋的意图:

白1刺永远都是先手。在左上二路立之后,黑棋边上实际上就只有一只眼了。如果将来出头不畅,就必须在A位团,单官补活,这显然毫无效率。

所以左上二路的白棋立或黑棋扳,虽然并非直接决定死活,却也能显著地影响到左边黑棋的安危。

要知道,下边黑棋也没活干净。黑棋如果两块不活,一个不小心就是被缠绕攻击的命运。


黑棋将左边两块棋连了起来,而下边白棋又经历了打劫活。

白146消劫、黑147长之后,白棋胜率为46.2%,接下来的焦点转移到了右边白棋身上。

黑147长就是为了向右边白棋施加压力,那么白棋该如何补棋呢?




AI推荐白1尖,白棋胜率49.1%。

这么下看似不紧凑,还留下了二路点的官子,但实际却是无可奈何的选择,因为......


实战白150贴住,本是第一感,为什么AI不推荐呢?

白棋这么下,胜率降至42.4%,因为黑棋将会有A位的二路透点!又是搜根!


AI推荐变化如上图:黑1透点之后,白2挡住,黑3二路夹是定式化的手法。占够便宜之后,黑7、9再威胁上边白棋,同时补强自己,如此黑棋不错。

至此,AI已经推荐了白棋对下边黑棋、上边黑棋以及左边黑棋的搜根,推荐了黑棋对右边白棋的搜根,各种朴实而又严厉的二路手段令人印象深刻。


欣赏完AI的搜根术,我们也看一下这盘棋的胜负关键处吧,回顾一下时哥是怎么输的棋。

黑187长,此时白188跳是败着,当年的解说说,时越出现了误算。白棋应该在A位粘住,如此有83.7%的胜率(实际胜率稍低,目数上可能只好半目)。

但白188以为有白B的出动,黑棋必须补棋,这却是看错了。


如果白1粘住,AI的推荐变化如上图。白3、5补棋之后,中央肯定能成一些空,黑棋破不干净。

如此一来,很可能是白棋半目优势的局面。


柯洁应该是发现了问题,黑189、191毫不理睬,直接将白棋中空破光。时越这时也没有别的选择了,白192出动,图穷匕见!

这里的关键是,白棋能不能吃住黑棋呢?时越是出现了什么误算呢?


实战,黑195顶的时候,我们发现白棋竟然不能在A位紧气,只能在196粘住。松了这一口气,白棋已经失败了。


白棋本来的计算应该是这样的:白1紧气,以下白3、5、7一路追击,白9打吃,这里是劫吗?不是的......


黑10提之后,白11粘住,白13可以从后面吃一个接不归,黑棋崩盘。

这不是挺好的吗?哪里出现了问题呢?


白1紧气实际是不行的,因为黑2可以扳上来,弃子转换。

如果白3吃住黑棋五子,黑4反打、黑6粘住,我们发现右上白棋全死了!这肯定不行,得不偿失。


所以,如果白1紧气,黑2扳,白棋顾不上吃黑子,只能白3夹,抢救上边白棋。

可是这样一来,黑4打先手,黑6、8、10一路连回家,反而把白棋中央全部吃掉了。

过程中,白5在10位鼓劫也是不行的,黑棋先手提劫后将万劫不应。


因为以上的变化,所以白196只能粘住,如此才能同时抢救右上和中央。

然而松了一气,无论如何也吃不住黑棋了。黑201回手吃两子,白棋还得再后手补棋。

下到这里,白棋就不行了。虽然差距很小,但白棋小败的结局基本无法避免了。

这盘棋哪怕放在今天,以AI的眼光来看,也是相当精彩的高水平发挥,双方大部分时间在半目胜负上下徘徊。

然而,AI对于几次搜根的强调,对威胁边上孤棋的强调,令人印象深刻。笔者认为,在AI的复盘中,这是最值得我们学习借鉴的地方。柯洁小胜之后,比分变成1:0,时越已经站在了悬崖边上。

那么,第二局又是怎样的呢?柯洁是如何赢下这踏上世界第一的关键一局呢?我们下次再说。


user avatar   hu-yao-yu 网友的相关建议: 
      

之前我在自己的公众号中,详细聊了李昌镐在1996年东洋证券杯决赛五番胜负第一局中的白88这步意境深远的棋。

白88这招棋可以说是重剑无锋。

大家对此特别关心一个问题:

“AI如何看待李昌镐白88这步棋?”

这个问题很有意思,正好我一直想跟大家聊聊关于如何看待AI的意见这个话题,所以今天就着大家这个提问,跟大家一起讨论一下。

在讨论之前,我先抛两个问题出来:

1:如果李昌镐白88这步棋不在AI的考虑范围内,那这步棋就一定是问题手吗?

2:如果AI给李昌镐白88这步棋降了胜率,那就代表李昌镐在这盘棋中的胜算变小了吗?

这两个问题其实可以合成一个大问题:

AI给出的意见,就一定是好的吗?

下面我们先来看看AI是如何看待李昌镐白88这步棋的:

图1:我们先回顾一下李昌镐白88下在了哪里?

白88下在了上面的一路立,这步棋看着很慢,其实意境深远。

关于这步棋的故事,我之前已经说了,这里就不多讲了。

我在写李昌镐白88这步棋之前,就看过星阵的建议,白88这步棋不在星阵的选择范围内。

而星阵的首选,也就是它推荐的一手棋是:

图2:我估计李昌镐若在当时看到星阵白1这步推荐,应该会吓一大跳。

这是孤身单挑黑三角六子的节奏。

的确,别说是李昌镐这样谨慎的棋风,就是剑法最霸道的申真谞来了,估计也不会去动黑三角六子的脑筋。

当然星阵有它的理由,它显然不认为你黑棋三角六子很强,它要来攻击黑三角六子。

那么星阵推荐的这步棋就一定适合李昌镐来下吗?

下面我就以虚构的形式,来跟大家推演一下,如果李昌镐采取了星阵的推荐,会发生什么情况:(以下内容纯属虚构)

图3:李昌镐正准备下白88(白A),心里想着:“这步棋虽然实地价值小了,但是可使白三角大块彻底净活,而黑三角大块则没有安定。关键这样简化了局势,接下来慢慢小刀割肉。这种局面是我最擅长的。”

正当李昌镐要落下白88时,星阵突然出现,悄悄跟李昌镐说:“我觉得白1这步棋胜率最高,我推荐白1这步棋。”

李昌镐一看白1这步棋,心想:“白1这步棋不像是优势情况下的招,倒像是形势不利下的胜负手,可这时候明明是白棋形势好,这步棋靠谱吗?

但星阵实力那么强,它推荐的招,总不会错吧。”

于是李昌镐就改变原计划,采取了星阵的意见,下出了白1这步棋。

而此时李昌镐的对手,正处于劣势下的马晓春,正愁全盘找不到敌人可以搞乱局面。突然发现李昌镐白1自己找来了,心中大喜:“此时不反击,更待何时!”

于是黑2反包围白1一子是必然的选择。

那么接下来白棋该如何处理呢?

图4:白1靠,利用黑三角孤单一子做文章,是星阵的后续手段。

李昌镐下出此手后,马晓春黑2长也是必然,不然在A的位扳的话,白棋在黑2位一虎,黑棋形有问题。

当黑4压的时候,星阵选择了白5、7顶断后,白9长出。

这下有意思了,原本是奔着收官格局去的局面,突然变成了乱战的格局:

图5:当前局势,处于完全混战的局面。

黑棋左边三角大块、上方圆圈大块、中央方块四子均没安定。

而白上方三角大块、中央圆圈两子、包括左下白方块四子也有隐患。

因此马晓春肯定要黑1飞,先把左边黑三角大块和上方黑圆圈大块连络再说,顺便也起到了分断白圆圈两子和上方白三角大块的作用。

虽然黑自身还留有白A位靠的手段,并未完全连络,但是白棋左下也欠着黑B位扳的手段:

图6:黑1飞的时候,假设白2跳一个,那么左下黑3、5扳了一虎后,白棋若防A位的断点,黑B位扳下后,原本与世无争的白三角一子也被分断加入了战团。

整个局面就一个字:“乱”

图7:所以当马晓春黑1飞的时候,李昌镐是已经彻底晕菜了:“本来可稳稳拿下的棋局,怎么现在头绪越来越多,完全看不清了。”

而马晓春此时则越战越兴奋,士气大振。毕竟在劣势下,能争取到与对手有50%概率一赌生死的机会,那是多么幸福的事情。

此刻的李昌镐,不知路在何方,只好继续求助星阵。

星阵当然有招,对于它来说,这怎么会是五五开的战斗呢?这明明就是八二开的战斗。

不过星阵也是悄悄来到李昌镐身边,不易停留太久,于是准备撤退。

而且星阵觉得:“我都给你教到这里了,剩下的就好办了,你自己来就可以。”

李昌镐这下傻了:“让我自己来?你把我领到最复杂的时候,你让我自己来?”

李昌镐本来就不擅长这种几块棋乱战的局面,再加上他原本就是优势的一方,此时出现这样的乱局,他的心态也难免受到波动。

而马晓春本来在劣势下正愁找不到头绪,现在出现五五开的战斗乱局,那简直是白来的,那他肯定是越战越勇,哪招最狠就来哪招。反正本来就是输面大的棋,杀输了也没啥,但要是杀赢了那就赚了。

之后的情形可以想象,李昌镐在大概率上会遭到马晓春的逆转。

虽然星阵还是没有想明白:“这变化不是很简单吗?我都算了几百万个变化,肯定没有问题的。为什么李昌镐被逆转了?”

星阵同学,你可能忽略了一个问题:

“李昌镐虽然是绝顶高手,但他毕竟还是个人,而你是AI,你俩的计算资源差了好几个量级好不好。”

那么关于星阵为何觉得白棋可战,这其中涉及的变化就太多了,估计我自己都要先在棋盘上研究一天,都还未必能搞清楚。所以就不在这里跟大家聊了。

好了,以上这个虚构的科幻故事讲完了。从中我们可以看到两个关键问题:

1:我们和AI之间有个不对等的地方,那就是计算资源。它一秒钟可以计算许许多多的变化,我们可能只能计算一个变化。
比如AI觉得白棋完全可战的时候,李昌镐可能已经一脸懵了。

2:AI与我们之间也有个不对等的地方,那就是人性。是人就有情绪、有欲望、有心理波动,有自己的长处和弱点。而AI的计算里,并没有把这些变数给算进去。
比如李昌镐发现原本可简明优势的棋,突然变成五五开的乱战局面时,他的情绪会出现负面的波动,而这又是他不擅长的格局;而劣势下马晓春此时一看有命可搏,则士气大振。这些看似无形的因素,是会对最后的胜负产生很大的影响。

所以李昌镐白88下立,虽然在AI眼中,不是一步正解。

但它在1996年,也就是24年前的那个时代背景下,这步棋就是通往胜利之路最快捷也是最简洁的一手。

因为那个时代的李昌镐,有一个很大的特点就是不动如山。他能控制住自己的贪欲,尽量把棋局导向他能掌控的局面,哪怕最后仅仅只是小胜。

因此从技术的角度来看,这步棋安定了白三角大块,使得黑三角大块更为不安定。从而消除了局面的变数。接下来的一切都在李昌镐的能力精算范围之内。

而从心理的角度来看,此手下完后,李昌镐的心态愈加笃定,而他的对手马晓春则在劣势下一时找不到敌人,心理越发着急,结果很可能露出破绽被李昌镐扩大领先优势。

而AI推荐的A位这步棋,也许相比李昌镐白88来说,离围棋上帝眼中的“正解”更近,但问题是,这招棋未必适合人类棋手;更不适合李昌镐这样的棋风。

这招棋从技术的角度来看,它使得原本风平浪静的局面突起波澜,搞得好几块棋都加入了战团,那么这种局面对于人类棋手来说,已经超出了他们的精算范围之内,后面的胜负,将完全听天由命了。那么这对于执白优势一方来说,这个策略无疑是不合理的。

那么从心理的角度来看,这招棋一下,使得原本处于优势情况下的白棋变成了五五开的乱战格局,那么李昌镐心里就会开始发虚,而马晓春则光脚不怕穿鞋的,求之不得。这样一来,率先露出破绽的很可能就变成李昌镐了。

所以我们现在回头再来看,假设李昌镐白88下完后胜率是70%,而星阵推荐的这步A位下完后,胜率达到了90%。

那么对于星阵来说,白88无遗是降了胜率;可对于李昌镐来说,若是下了A位,倒反而是降了胜率。

那么到底谁对谁错呢?

谁都对,只是他们本就有不同之处罢了。

原因还是那两点:

1:人类棋手没有AI强大的计算资源

2:AI不了解人类棋手的心理变化

最后我再聊聊这两点:

第一个问题:由于人类棋手没有AI强大的计算资源,因此很多时候,AI觉得没问题的路,只是因为它掌握了越过这条路的路径和方式。但这未必适合于你,也许你选了这条路后,你就掉坑里去了。

这就好比是小马过河的故事,大象觉得这条河很浅,可小松鼠若听了大象的话直接就上了,那它一下水,就会发现,这水太深了。

所以到底这条河的深浅如何?小马还需要结合自身的情况和特点来独立判断。

第二个问题:AI所计算出来的结果,并没有把人类的情绪和心理波动、以及其自身的性格特点而导致的非理性行为给计算进去。

举个例子,AI通过超强的计算力,可以计算出股票市场的大致走向,但这是建立在“人们都是在理性的投资”这个前提下。可事实上,这个前提存在吗?一个涨停板,我们的心跳加速起来;一个跌停板,整个人又都不好了。市场上一个风吹草动,就会给市场造成极大的波动。这些人性的特点所带来的变量,并不在AI的计算范围内。


所以AI的建议,只是在它的计算能力范围内,以及去除了人这个复杂变量的前提下,所得出的最佳答案;可对于我们人类而言,这个答案到底适不适合我们拿来用,这还需要有一个自己的判断和筛选。

我有时会看到这样的话:

“你看,以前大家认为某某某很牛的一步棋,现在拿AI来看,也不过如此嘛。”

怎么个不过如此?这不是简单放个胜率就可以定案的。

若要想定案,至少需要有以下几点说明才是:

首先,你需要说明AI给出的意见,其背后的用意是什么?同时解释一下它这步棋比对局者当下这步棋好在哪里?比如AI白1这步棋是想冲击黑左下六子,它认为黑左下六子并不厚,如果能冲击到,那么李昌镐白88就成了缓手。

然后,你还需给出自己的判断,就AI这步棋虽然好,但到底适不适合我们使用?比如白1冲击完所引发的战斗,是否在人类的计算范围内能看出白棋的确明显可战,要是大家一看,这不是五五开的战斗吗?那就要掂量一下,这是否适合我们使用,尤其还是在局面优势的情况下。

接着,如果AI推荐的这步棋,的确适合人类棋手使用,那么是否适合当下对局者的棋风特点?比如李昌镐明明是不动如山的风格,你偏要他跑到左下去挑衅黑棋,关键这个战斗获胜的概率也就60%,那你很可能就是坑他了。

再接着,你还需要考虑到两位对局者在当前局势下,所处的心理状态又是什么样的?明明一方处于穿鞋的状态,另一方处于光脚的状态,你说AI认为他应该下得更积极些。但问题是,AI没有风险这个概念,但人面对风险时,心态是会有波动的。

最后,若是评价历史棋局,则要回到那个当下的时代背景去理解对局者的招法。

比如常昊和崔哲瀚那次应氏杯决赛第三局,也许常昊那步白92脱先并非最佳之手,但这步棋对于常昊来说,就是在精神上突破自我的一手,就是因为他具备了下出这步棋的勇气,所以才能凤凰涅槃。

所以,解释AI的意见,不是那么好说的,起码不是随便一句:“这步棋不是AI推荐的或者降胜率了,所以差评。” 就能搞定的。

AI的胜率之下,有着人类无法企及的计算资源,所以我们要对AI的意见持有自己的主见和判断,不然AI是没事,但你却很可能掉坑里去了。

AI的胜率之上,则有它无法预测的人心。人,这个复杂的变量,本就是围棋的重要组成部分。

两位对局者在棋盘前,不仅要比拼技术的高下,同时也在进行心理上的博弈。

所以只要还是人和人在对弈,那么围棋的乐趣就永不变。




  

相关话题

  芯片晶体管数量超过300亿大概要多久? 
  如何看待柯洁宣布「这段时间不会再碰围棋」? 
  古代围棋的实力能和现在的比吗? 
  为何总感觉人工智能和神经科学(神经网络)被绑在一起? 
  因果推断(causal inference)是回归(regression)问题的一种特例吗? 
  如何看待 Facebook 首席 AI 科学家 Yann LeCun 被群骂? 
  如何看待 Google TPU?寒武纪芯片较之有哪些优势与不足? 
  大四年级,完全没接触过高数,目前对机器学习产生浓厚兴趣,该如何学习数学? 
  5-10年后,你觉得哪些科技会让我们“遗忘”现在的生活? 
  让人工智能去下路边街头的象棋残局会赢吗? 

前一个讨论
让人工智能去下路边街头的象棋残局会赢吗?
下一个讨论
如果围棋已经被人工智能完全破解,得出某色必胜,那围棋还有什么意义?





© 2024-12-22 - tinynew.org. All Rights Reserved.
© 2024-12-22 - tinynew.org. 保留所有权利