百科问答小站 logo
百科问答小站 font logo



从围棋角度看李世石与 AlphaGo 的第二局比赛有哪些关键之处? 第1页

  

user avatar   windycloud 网友的相关建议: 
      

最近参与了几个讨论,我发现大家普遍对Alphago理解出了问题,我想明确的先说我的观点:

这次的比赛看点主要是Alphago对局势的评估系统好还是李世石九段对棋甚至职业棋手们对围棋的评断标准好。

在我看来,Alphago对围棋界的积极意义和吴大师提出新布局有同样的地位(甚至更高),都是对围棋理论的重大推动。看的过程中,棋迷朋友们可能会明显感觉Alphago大量俗而有力地下法是它简明取胜的不二法宝,很少保留变化,目的十分明确,有一点像全盛时期李昌镐和小林光一的下法。

很多人总爱拿计算力说事,讲道理计算力强从来不是真正的亮点。且不论现在计算力远远达不到穷举围棋变化的地步,大家可以先设想一下,假如你可以一个汉字一个汉字穷举完世上所有的诗歌,如果你没有一个评判标准,既没有什么时候表达什么的需求,也不知道每一篇是什么用意,请问那对你的创作有什么实际意义么。

Alphago的突破在于他在关键地方节省了计算资源,建立了优秀的评估标准指导自己的每一步,从这两盘来说,创新能力很强,开局套路都是几乎从没出现过的,中后盘分寸感非常好,进退有度。

推荐想认真理解整个架构的移步田博士的专栏:

AlphaGo的分析 - 远东轶事 - 知乎专栏

我在这里简要说一下,AlphaGo这个系统由蒙特卡洛树搜索做核心,把三个部分连接起来,分别是:1.走棋网络。2快速走子。3,估值网络。

上午有人问我,是不是Alphago以下出最强变化为目的,以我现在看到的来说,绝对不是,他在一个局部得分以后会在其他地方选择明显保守一些的变化,十分中正平和。

我感到很多时候大家忽略了Alphago背后团队对Alphago各种参数进行调校的重大影响,要知道无论是算法还是数值都是aja huang以及背后他们的团队在发挥最大的作用,任何过分夸大算法本身的言论都十分的无厘头和荒诞。

{关于人脑的思考方式和Alphago的不同,这里链一篇

AlphaGo 下棋的策略套路与人类策略有哪些相似吗? - 人工智能





以下我们简单讲讲第二盘,如果说第一盘石头输在了大局,这一盘如果一定要找个原因,那是因为李世石下的太过保守。

【布局】

开局Alphago依然十分新颖,这样的开局方式还是第一次见。看到很多人局后表示不会模仿,感觉Alphago的棋风已经让人有一种很难模仿的感觉了。


前面出现类似局面的棋我简单翻了几十盘,常昊九段最近的下法是一般的下法:

(参考图)

图中黑13,拆边巩固自身。之后快速尖出作战。

——————————————————————————————————————

再贴一张赵汉乘九段去年的棋谱供大家参考:


(参考图)

图中同样黑13拆边巩固自身,不同的是选择了弃子的战略。

——————————————————————————————————————————

而Alphago下的棋如今已经自成一派,十分有自己的风格了。之前我曾经以为Alphago对定式的使用会非常纯熟,现在看,大量学习各种棋谱以后Alphago对所有的局部仿佛都有自己的理解。实战Alphago先刺再托,很有个性。

之后的进行,Alphago继续选择少见的下法,俗而有力地尖顶。之后Alphago走出了聂棋圣认为应当脱帽致敬的好棋。37肩冲:


真是天外飞仙一般的好棋,十分潇洒。私以为这一步与其从好坏上来评价不如从试应手的角度来考虑,根据白棋贴的方向决定自己之后的进程。

【中盘】


黑棋主动挑起战斗以后,暴露出一定的短板,实战的下法备受诟病,46扳起这一串下完之后Alphago无论怎么分析Alphago都亏损了,这里是石头本盘唯一得分的地方。当然如果说之前黑棋右边得分了,Alphago这里选择稍亏一点的下法也十分可以理解。



白棋这盘右边效率低下的问题越来越明显。昨天第一盘小李就在后半盘连落两个后手,被Alphago大幅拉开,今天这一盘依然出现了这样的情况。这时候的打拔,感觉过于稳健。此时左边的黑棋大块和两边都没有清楚的连接,李九段没有任何追究而是右边厚上加厚提了一个,仿佛期待Alphago在角上补一个似的,之后Alphago补上联络,作战机会就此失去。

看到这里我就默默关掉了直播,倒了杯水,怔了好久。

这盘进行到这里完全看不到小李的剽悍风格,看到这里感觉非常遗憾。之前我的群里曾有一段时间大家专打李世石的棋谱,贴一盘去年年底的:

(参考谱 李世石九段对宋知勋初段)

充满了嗜血,战斗,最终大杀小输赢,细腻的赢了半目,我想也许这才是我心中的疯狂的石头。

这盘后来Alphago安全运转,石头没有抓到一丝机会。


【拼搏的打入】

石头实战最后打入Alphago唯一一块薄弱的地方,我看着高手摆了无数个变化,发现实战Alphago选了一条变化最少,最粗俗有力的路:

至此,石头局面进一步落后,失落。

【最后悬念】

这盘给我最大的悬念依然是为什么石头没有选择打劫,即使在局面很差,满脸涨红的时候还是没有选择下面这个变化图,我至今想不明白,只能期待石头自己解答了:

石头认输的那一刻,我看到李世石九段极度难过的表情,承受了多少压力我们旁人感觉不到,希望石头重整旗鼓,再次展现出凝固空气的炽烈杀招,为胜负师之路不留遗憾。

贴一张休职复出后李九段犀利无比的照片,祝调整好状态,发挥最好水平!

p.s:一直有人说有什么打劫的保密条款,这一点我坚决不同意,但是劣势之下安乐死的小李的状态让我觉得他可能不该作为人类一方出战。


user avatar   pandanokungfu 网友的相关建议: 
      

没有太多时间写一个长答案,就简短说一下我感受最深的一点吧:

现在职业棋手判断形势的算法,有明显漏洞。

职业棋手判断形势的算法大致可以概括成一句话:估算双方的目数(地盘大小)差距。

那如果地盘的边界没有完全确定怎么办呢?如果有先手官子就判给先手方,如果是双方后手官子就算一人一半。

那么有一些模糊的地方,比如说一块厚势折算成几目呢?这个就只能凭感觉了。

今天看各个平台的解说,大概是柯洁的判断最准确。柯洁在中盘阶段就点出黑棋盘面15目左右。古力一度判断小李优势,甚至到官子不多的时候还认为是细棋。金明完也差不多。麦克雷蒙的判断没有仔细听,好像比古力要准一点。芈昱廷在128手的时候认为还是细棋(这个时候柯洁已经判断黑棋明显领先了)。围棋TV的完全没有看,请各位补充。

暂且不论到底是谁的判断更准,我们可以简单看一下白128手时候各方的判断。有柯洁说黑棋领先一个贴目,也有说细棋的,甚至有说白棋小优的。这些职业棋手对同一局面判断上的分歧居然能超过一个贴目!这恰好证明了上述算法模糊之处可能产生的巨大误差。

那么我们思考一下误差可能产生在何处。第一,先手官子判给先手方。然而在棋盘上,“先手”是个相对概念,逆收官子屡见不鲜。甚至在有些情况下,面对“绝先”,奋力一搏选择脱先他头也不少见。第二,模糊判断。这个问题更大。职业棋手对一块棋厚薄判断的分歧,很可能导致点目结果的南辕北辙。

AlphaGo是如何做形势判断的呢?AlphaGo策略组合的其中一部分是价值网络。这一部分的原理以我的水平解释不清楚。为了方便理解,我们考虑前一代AI,Zen的判断方式:通过大量的随机采样估算“胜率”。打个比方,一盘棋下到120手。在这个时候AlphaGo随机落子完成一盘棋,然后判断哪一方在这个随机完成的一盘棋中获胜。重复这个流程多次,比如说十万次,然后其中三万次黑胜,七万次白胜,那么估算出白方的胜率就是70%。

当然,AlphaGo的价值网络比Zen的方式要先进很多,让估算的胜率更加准确。

感谢评论区

@刘嘉耿

的补充:

AlphaGo并非完全随机地模拟剩下的棋局,而是参照了之前的棋谱用落子选择器找出最有可能的几个点,保证速度

从效果上来看,估算胜率的效果其实非常好。而且我认为,这样的判断方法是本质的。

为什么?首先要明确,虽然理论上来说,某一个局面下,要么是黑方必胜,要么是白方必胜。然而,由于围棋事实上无法被穷举,只能退而求其次估算概率,或者像人类棋手一样估算双方相差的目数。然而,在很多情形下,相差多少目数是没有意义的。

举个例子(此处应该有图),黑方确定目数70目,没有潜力。白方确定目数40目,有一块40目潜力的大空。如果黑方立即打入并活出,则40目的潜力只能转化成10目的实地,黑方获胜。如果黑方打入失败,则白棋40目大空围成,白方获胜。黑棋也可以选择保守的浅消,则白方的40目潜力大约能转换为25目实地这个局面下,如果选择浅消,虽然最后差距会缩小,然而其实胜机也很少。很遗憾,这种局面下,职业棋手很难准确估算打入成活的概率,然而AlphaGo可以。于是心存幻想的人类棋手觉得落后不多,而打入无成算,选择浅消白棋大空,结果白方40目的潜力转化成25目实地,黑棋盘面仅多5目,从而落败。阿尔法狗估算出选择打入的胜率是40%,而选择浅消胜率仅为25%,于是毅然选择打入。不论最后胜负如何,选择打入显然是更好的策略。

换句话说,只“领先两目”而胜率80%,和“领先五目”而胜率70%,其实是前者优势更大,然而人类会认为后者优势更大。这或许是人类棋手的命门所在。

可叹的是,人类不可能通过大量随机采样来估算胜率。

╮(╯▽╰)╭

针对评论,补充一点吧。评论区说古力是故意模糊判断形势,实际上他是点清楚了的。也许有这个成分在里面。但是,我作为一个常年在各大平台看围棋直播的棋迷,经常能看到对于同一盘棋的同一个局面,一个解说认为黑领先,另一个解说认为白领先的情况。而且这俩解说都是顶尖职业。事实上职业棋手并不能准确判断形势,即使是在中盘阶段末期。


user avatar   qiu-ran-ke-79 网友的相关建议: 
      

整盘棋就一个感觉,AI不在乎。

这其实一种很绝望的感觉,无论人类怎么应对,AI只要回应了,就说明,在AI的计算里,他能赢。

很是唏嘘,李世石年少成名,一生艺业,要在一个“死物”手里,受如此折辱。输不可怕,可怕的是对方不仅能赢你,而且眼里没有你。

现在看来AI眼里的亏损和人类眼里的亏损是不一样的,前期的几手人类看来的损手,俗手,对于AI来说是有利。注意,并不是说AI就是一定能在开局就算到这几个子在以后发挥价值,而是对于AI来说,局面的明朗要优于前期的争夺,只要AI认为盘面上可以获得足以取胜的目数,就不会在意亏损,等于说把你最终会获得目数提前预支给你而已。反倒是盘面上的空格越少,对于AI越有利。

要赢,要么,在逻辑上超越AI,让其自认为的最优解实际上不是最优,这是以前的围棋软件常见的弱点,但阿发狗不确定存不存在,或者人类能否找到的。要么,让AI停止落子,说明他找不到能赢的解了。

从直播来看,柯洁的眼光至少领先古力大约5-8步棋。如果说围棋总分100,目前的李世石大约有4,人类的顶尖水平大概在5左右,柯洁有6,AI的表现大约在5.5-6.5.

---------------------------

补充一下,这个不在乎并非是AI主观上的情绪,而是一种客观描述。对于AI来说,人类选手的每一次落子,等于从一个新局面开始计算。所以,AI回应的那一步棋,一定是他认为“会赢”的那一手棋。这其实既是一个好消息,也是一个坏消息。好消息在于,AI依然不理解人类的模糊选择,味道、可能性这些东西。而坏消息在于,仅靠着把棋盘收敛,AI已经可以凌驾于人类棋手之上了。

我看好柯洁,是因为目前来看,柯洁是看棋的这帮人里,最能跟上和预判AI思路的人。


user avatar   milkmeat 网友的相关建议: 
      

我觉得这个程序已经对人类无敌了,柯洁大棋渣来也一样

今天现场嘉宾解释了,计算机会选择获胜概率最大的走法,至于赢多少目不在考虑之中。假设有两种走法,A有80%的可能赢20目,B有90%的可能赢1目,程序会选择B。而人类往往会选择多积累一些优势,以便后面出勺子的时候还可以兜住。

这样就造成计算机看起来总是只比对手强一点点,只要够赢就可以了。他跟二段下,看起来就只有三段水准。跟李世石下,看起来不如柯洁。跟柯洁下,仍然要比柯洁高一点点。如果Alphago自己跟自己下,人类就看不懂了。就像我看不懂9段的棋一样。

update - 评论里吵起来了。附上 alpha go 论文下载链接

kam.mff.cuni.cz/~spring

,需要的自取


user avatar   xie-dan-9 网友的相关建议: 
      

第一天,李世石是采取了怪招+手段过分的测试招法来测试AlphaGo.

今天,李世石是采取了本手+最佳手法来应对AlphaGo的。

如果说,第一天还是上手心态,有些轻视的话。今天是绝对的尊重了。甚至在AlphaGo 明显有问题的手法上,也采用了足够的思考时间。

今天是真正的败了。(第一盘李世石还剩余时间,今天进入了读秒。)

从内容看,AI在前面还是有一定的弱点,但是没有明显的大错误。而后半盘的精确计算,显然使得李世石的压力非常大。任何人在这种情形下,都无法下出最佳手。

现在,可以预测,李世石最多能做到一胜。

这个基本证实了我在赛前的猜测,AlphaGo在内部评估时,等级分超过了李世石了。

假设没有瓶颈,李世石最好的可能是人类最后一次战胜AI。

个人猜测:AI的算力明显高于李世石了,建议下一盘以委屈捞地为手法,把不能掌握的外势让给AI,争取四角穿心的走法。

AI胜了两局,李世石还有机会吗? - 啥都好奇 - 知乎专栏



  

相关话题

  如何评价第一局比赛 AlphaGo 战胜李世石? 
  5-10年后,你觉得哪些科技会让我们“遗忘”现在的生活? 
  劳荣枝二十年后被抓,容貌和20年前变化很大,警方是怎么判定她是劳荣枝的? 
  AlphaGo 在围棋上战胜李世乭后,人工智能的下一个目标会是同为「有限元素组合创作」的音乐吗? 
  下围棋,被对方星位一间低夹怎么办? 
  简要概括人工智能? 
  用生成模型做数据增强data augmentation时,如何从合成数据中筛选出质量较好的样本? 
  如何看待 人工智能(AI)人才抢夺热潮,应届博士年薪涨到 80 万这一现象?未来前景如何? 
  如何看待 AI 方向 PhD 申请竞争过于激烈的现象? 
  2022 年初,你认为哪项成果代表了现在人工智能的最高水平? 

前一个讨论
AlphaGo 下棋的策略套路与人类策略有哪些相似吗?
下一个讨论
家有琴童一个,学习钢琴一年零两个月,现有一问题想向大家请教:如何把情感倾注到手指上?





© 2024-12-26 - tinynew.org. All Rights Reserved.
© 2024-12-26 - tinynew.org. 保留所有权利