今天看到媒体风向又大转,这股风气很像二级市场,暴跌的时候一顿臭骂,暴涨的时候一阵欢呼。昨天担心终结者,今天又说人工智能是人类的好陪练。其实人工智能改进中总是会有不足的地方,但就本盘而言,能发现程序的漏洞还是石头斗志顽强,才华横溢固然重要,无论面临多难的局面,哪怕已经必败,重大压力之下仍保持冷静的精神力,保持昂扬斗志才是成就一个胜负师内心小宇宙的核心因素。
这盘的内容非常有趣,私以为已经暴露一定Alphago的系统问题,从序盘之后疑似计算有误到明确的手筋应对失当以后胡乱拍子。
人靠逻辑进行决策的条件在这局完胜没有逻辑靠估值网络进行概率分析的系统。Alphago的计算能力短板这一盘充分暴露,非常有意思。当然李世石下一局可能不容易再触发Alphago的这个短板。不过胜负师李世石已经让这一盘极有价值。
(犀利的小李,感觉这次比赛之后李九段又会有新的飞跃)
【看点】
本盘的看点可能并不是挖本身有多妙,至少我从高手那里得到的变化图看目前还有疑问,看点在于Alphago应对自己没有算到的变化会怎么应。
我今天也很开心,毕竟压中小李。私以为很多未来说不清的判断问题,关系到实际态度立场的时候,赔率是很重要的考虑因素。我之前主持几个小讨论,问参会的大家对最终胜负和具体比分的猜想,发现赔率也是会影响表态的。说到底是不确定的事情,一定把自己预设在一个范围里并不十分理性。这个问题不再展开多说。
之前的三篇棋评反复希望大家能够抱持一个客观科学的态度去看人工智能。这几天偶尔有些人跑来我们的开放大群谈自己的见解,仔细一问既不懂棋也不知道算法基础,只是为了表达一个态度而来,也只是为了支持强化自己的态度而来,我不欣赏这种交流方式。围棋这股热潮终会过去,每年的热点都多得是,学到比说到要好得多。
今天小李下的很好,既然赢了,总没有再说不好的道理。今天的棋下得实在好,看完直播我又摆了好几遍,我看现在棋评已经很多,就简略说一些提及较少的部分做一些资料扩展讲解好了。最近很多人跑来说Alphago不按棋理下棋,不过9位挂一下再虎是很多年前的套路,Alphago乐此不疲总是使用这个套路。
【序盘】
李九段根据第二盘经验白12反占黑棋第二盘尖的“要点”,黑棋13果然拆了。到这里是普通套路。我这个局部翻了十一个谱子,都是女棋手下的,感觉很有意思,贴几张图给大家看看。
{伊藤友惠vs 小林礼子}
1965年伊藤友惠老奶奶的对局,左下角下的还挺奇怪的哈。不过构思很有意思。
{奥田彩 vs 冈田结美子}
这是12年日本两位实力美女职业棋手下的,开局和Alphago这盘比较相似。后来引征右上以后的转换很有意思。
[妖异的一碰]
序盘进行的十分平凡,已经是十分常见的下法,感觉进入小李熟悉的局面,实战白右边拆边之后黑棋妖娆的一靠,感觉不是棋,可能是对自己的局面的判断不乐观了吧。
【中盘】
{Alphago的棋风}
四盘看下来,Alphago有个特点越来越明显,那就是对肩冲的偏爱真是太明显了,绝少打入,基本都是肩冲:
(绝少打入,以肩冲见长的alphago)
白棋征子有利,黑棋计算暴露出问题。
从这步以后Alphago走的不知道怎么回事,开始有深一脚浅一脚的下法,李九段开始稳扎稳打了。正所谓,棋稳如“go”。
[疑问的 神之一挖]
白棋走的十分稳健平和,26,34,都十分中正,感觉石头找到一点对付Alphago的策略了。
最近有人问我有没有Alphago流,我感觉妖娆的肩冲是Alphago最鲜明的特点,打入少,肩冲多,想必对打入估值不高。
实战的Alphago,面对78“挖”很快就非常不妥的退了一个。
(疑问图 1)
这盘棋挖完之后,Alphago感觉慌了神,开始乱下了,这里明显李世石的手筋超过了Alphago的预想,不过严格来说,这个挖到底成立不成立,大家如果有任何疑问,我会继续找高手继续求证,目前来讲,如下图变化远没有没有如实战一样严厉的结果:
(疑问图 2)
此变化图来自于职业棋手
@杨冬局后的复盘探讨。白棋妙手之后仿佛并不能形成特别好的战果,这里因为Alphago只用了很短时间就应了,明显没有这里的清楚计算。
【中后盘作战 Alphago的 连续判断失误】
白棋使出挖之后Alphago好像彻底慌了,当时笔者在外溜达,看着几步下的简直笑翻,看来人工智能目前还是有些硬伤,一旦走出它计算范围以外的招数,就彻底没了章法。
东施效颦,这一挖直接让人笑翻。
这步立净亏两目以上,直播到这时,李世石也笑了。之后作战Alphago大乱方寸,再也没有了机会。
Alphago这盘,赢棋欢乐多……哈哈。
【结语】我有一个比喻想再重申一下,我希望大家把人工智能当成是士兵外骨骼这样的设备,它可以带着你用更快的速度跳跃,搬运,前进,观察和探索。Alphago作为一个随时可以全状态上阵的超高水平陪练,他一定会对旧的围棋理论展开大量革新。
最近有职业棋手表示围棋的魅力最近几天变得大了很多,思路开阔了,一口气上五楼,不喘气。
不要像香港,台湾一样,本来是个贸易中心,经济衰落的一塌糊涂,还反过来抵制大陆人去旅游购物,愚蠢透顶。
大势面前更好的顺应趋势才是我们应该思考的
先恭喜李世石。
这局棋有两个值得关注的地方:
一是AlphaGo在李世石下出“世纪妙手”之后第79手应对错误,之后再无翻盘可能。这差不多可以证明人类顶尖高手在后半局的计算上已经可以做到无限接近完美。从计算方法来说,AlphaGo的算法无局部概念,每一步都是全局计算,而人类是做局部计算,因此用更小的计算能力可以达到同样的遍历。
二是AlphaGo在发现自己落后的情况下,也就是自己89手开始,频出无理棋。了解蒙特卡洛算法的话就知道这是一定的,因为每一个绝先的无理棋都有对手应对失误的可能,那么必然值得一试,反正对手应对正确也不会降低自己的获胜率。至于每次下无理手亏多少,根本不在考虑范围内。其实也就是这时候开始,AlphaGo已经知道除非对手犯错否则自己必败了——同样有趣的是,当AlphaGo觉得自己必胜的时候,也会频出不会减少自己获胜概率的缓手。因此将来一旦AlphaGo在中局之后下出职业棋手表示绝对问题手的时候,只要对手不犯错或者自己的计算出现盲点,那么其实整局胜负已定。
从AlphaGo角度来说,除非根本上改变算法,否则全局计算不会变成局部计算。落后出无理手,领先出缓手也都会一直存在。和棋手或者棋友的观点不同,这些其实都不是失误,不是bug,不需要改变,因为那时候反正胜负已定。今天真正值得团队研究的是为什么第79手的应对出了问题——或者说是否问题手出在更早的时候。是前面搜索的宽度不够?还是说用于概率剪枝的估值网络对78手的位置的价值作出了错误的判断?这个判断错误是可以通过继续自学习很容易弥补的,还是真正算法上的过拟合缺陷已经到来?对于AlphaGo来说,这是一个很有价值的bug。如果这是过拟合的问题,那它的意义就非常大,要么可以从根本上对整个算法产生疑问并使开发者进行优化,要么说明“围棋上帝”已经不远了。如果不是,那么再自学一两代或者加点机器就很容易解决。我个人倾向于后一种。
而从人类棋手角度来说,那么这里其实抛出了另外一个问题:当围棋进入中盘之后,在大部分棋局形势下,是否其计算量已经进入了人类棋手的脑力进行局部计算可以完美对弈的情况?将来的围棋比赛是否就是保证自己中后盘不失误的情况下拼开局?如果是这样,那么AlphaGo以及将来其他围棋软件的布局就会成为棋手学习的绝佳参考。如果不是,那么在AlphaGo继续自我学习之后,可能会在错下一两手之后仍然靠复杂的计算而取胜。
如果比赛4:1结束,白78这手必然会载入围棋史册。它要么是人类棋手在人工智能棋手的碾压式计算能力面前最后的辉煌,要么是人类棋手帮助人工智能棋手打开一个新纪元的大门的钥匙。
我知道稍后肯定会有高手出来全面解析这局棋的。作为计算机(也就学过算导)和围棋(业5)两个领域的入门者,从两个角度提供我的看法吧。
首先看棋。
开局与第二局相同。
开局白12率先变招。没有按部就班地按第二局进行。如此AI就不能再脱先走上方中国流连片。因为尖起后的夹攻将更为严厉。
白18拆边,没有走经过多年研究的右侧参考图。稍有疑问但可能是害怕参考图黑4走在白5处托角。
(这一段可跳过。这个局部我要解释一下:白18后,黑棋虎角是非常大的一手,因为如果不虎,将来白棋存在扳出的手段。因此18后的虎几乎是必然的一手。而如果白棋走右图白1,那么黑2白3后,黑4虽然也是巨大但是守空不如虎干净,因此黑4可能走在白5处。正因如此所以一般认为白1是先手便宜了,如果局部要争先那白1是近几年来几乎必走的棋,李世石反其道而行之,看来他对这个局面必有研究)
黑23似乎无理。很像我在网棋里下出的。遭到白棋扳起反击。
至黑35,虽然黑棋顺利动出挂角一子并在中央形成势力,但白棋实地领先。不过之前的23达到此等效果,还是有些令人讶异。也许电脑真的在违反棋理的招法上能有创见。
之后的胜负取决于上方黑棋阵势能围多大。白棋至此形势至少不差。
白40碰大胆!虽然稍有疑问,因为黑棋扳立后右上角效率似乎过高。
46大飞,棋感良好,谋划很深的谜之一手。胜招之一。若即若离地动出上方孤子的同时,觊觎着左侧黑棋外势的弱点。
52扳,稍有疑问。直接断开黑棋可能更为有力。然而很难说。
58扳,之后如走参考图变化,则黑棋厚实,且存在K5位飞的后续手段,白棋联络不够完整。
62动出,似乎有些过分。如果这样形成的转换中,白棋左面四子死净,则应是断然不利。
黑棋69过分,不够简明。如按右侧参考图进行,个人感觉黑棋至少是小优局面。
事后证明,69是败招,之后形成的复杂局面是电脑的重大弱点。
经过几手准备,白78祭出神之一手。借用甘道夫的话来说,This move has not yet entered into AlphaGo's darkest dream!
之后局部将出现参考图所示劫争。很可能因此导致了电脑局部计算的崩溃。下面是我自己在另一篇回答的推断。
不管是什么原因,83以后由于局部计算错误,电脑开始按照自己的算法走出奇葩的下法。
至98,电脑连续送子,左下和右边亏损有20目。
至112,白棋顺利动出中央子力。至此,白棋胜定。
然后是算法视角。
至少现在看来,具有很大必然性的大规模复杂局部战斗很可能是AlphaGo的弱点。这种情况下,其利用卷积的图像处理技术发挥的作用颇为有限,毕竟,局部计算不能只凭相似性来破解。而由于隐含有劫争,这里的局部计算量可能出乎意料地大,需要计算的步数出乎意料地多,这可能超出了AlphaGo蒙特卡洛树的准确范围。据nature上文章介绍,它在快速模式下的树只有25层,在有劫争的复杂局部显然是不够的。总得来说,从这一局的情况来看,我认为AlphaGo的核心估值函数应该还有待改进。它需要能对局部战斗中的必然性变化有更好的处理,这类似于计算机围棋长期无法解决的连环劫问题。
很具讽刺意义的一点是,电脑的弱点似乎正是李世石的强项。不知Google方面是否也是考虑到这方面的原因才找到李世石进行测试。结果由于心态上的原因加上对电脑没有足够的了解,李世石在前两盘恰恰没能在他最为擅长的方面有所发挥,第三盘似乎找对了路线但发力点过于勉强,反而导致了崩盘。最终,在已经输掉对抗,放下一切包袱的第四局,长考后的李世石终于祭出了78的局部强手。可以说,这一局的李世石才是发挥出了他真正的实力(许多讲解的嘉宾似乎都没有看到这一手)。
78是凝聚李世石无数心血的一手。怎样煽情都不算过分。它告诉了我们,电脑还没能彻底征服围棋。而且我大胆预测,摸清电脑弱点的李世石在最后一局绝对会大展其所长,利用复杂的战斗击败电脑。继续期待后天的对局。
最后,讲道理这盘棋以及这次对战,也许对人类整体并没有媒体渲染的那么大的意义。当然,对于围棋界有不可估量的价值。对我个人来说,作为一个倾向李世石的棋赛观众,看到78后的一串落子,真是震撼感动(欢笑)兼有的美好体验呢。78这一手甚至比今年的全明星扣篮大赛以及库里绝杀雷霆的比赛加起来更有快感。
AI在劣势情况下的对应策略有问题。
之前我们知道了如果AI占优势,比如说盘面10目
它宁肯100%损5目也不愿意99%得5目外加1%损15目
也就是说不冒风险,漏洞极少,无懈可击。
然而在劣势情况下,假设盘面输6目
有一个走法A 80%扳回3目,另一个走法B 20%扳回50目
按AI和人的优劣比较它应该选A,一直慢慢追人类总有失误
今天后来的几手狗却都是选B,一旦成功马上翻盘但是被正常应对就毫无作用,常人不会下的棋。
可见它以自己为对手训练的时候得到的经验和人类对手比还是有所不同。
晚上大约谷歌工程师要回去想办法debug调权重了。
其实这个情况刚好证实了前三盘狗狗从没有过较大劣势,都是胜势或者平局(基本等于官子胜)。
所以它不断出正招就可以了,可以把李世石这样的棋手从头压到尾无需冒险。
依旧是个可怕的对手。
----------------------------
在下出逆转一手时,李世石观察局面的深度和计算能力超过了AI许多步。
AI在正面战斗中也还不是完全无敌的。
Hassabis 在推特中说狗没有及时认知到78的威胁,到87才发现胜率下跌。
这个说明狗在好几步后都不知道自己已经不妙了,计算结果里没有后来的发展。
这不是bug,是标准的多算胜少算,光明正大堂堂正正的胜利。
相同时间下肯定AI算力强,但是李在这一步花的时间远多于它。
如果是人人对弈,对面的李世石不惜读秒也要长考近20分钟下棋,这一子谁敢轻视。
但是AI依旧是你下你的,我下我的,没有根据对手的反应安排自己的计算时间。一分钟就接了下去,也没有看清后续。
无论如何这次在李九段全力施为之下,至少知道阿尔法狗的能力上限了。李世石这次花时间长考出来的计算力,要大于AI在前后一手中1分钟内的计算力。如果规则改成李世石每次至少半小时,狗狗只许一分钟,说不定可以公平一战。
但是它如果也愿意花上20分钟,甚至是全用掉高达50分钟的用时优势计算的话是否能预见到这一手及其后果呢?我很好奇谷歌方面这么复盘的结果。
对李九段来说,向计算能力和剩余时间都远多于自己的对手挑起复杂纷争绝对是前无古人的豪赌作死行为,非有铁胆不可。如果真的是他意识到AI的缺点有意为之并且成功实现,那就只能五体投地拜服了。
---------------------------
AI不考虑棋外手段。
仔细想想这是棋外的问题了,棋手会估算对方的棋力和风格,观察对方的神情和小动作,在自己时间充足的时候故意挑起复杂战斗,留下小利引诱对方进入陷阱,等等。
这些手段对AI都没有用,但是其实AI也不会利用这些手段对付人。
到底还是公平的。
----------------------------
几条评论非常精辟,直接搬运上来了。
熊光仪确实关键就是落后局势下的判断问题。搜索树逻辑把翻转整个局势获胜的重担压在一步上,使得落后情况下冒险小概率大赚的臭棋变成唯一选择,不足以翻盘的小赚被放弃。这应该是AlphaGo的逻辑bug,然而为落后局势单独写一个逻辑,还是有更好的办法一致性解决策略问题,可能不是一时半会能解决的。这也是人工智能提升的重大契机,人脑具有平衡长远利益和眼前利益的能力,能够面对不完全信息尽可能妥善处理和有一定的规划,还有待人工智能去实现。
熊光仪另外AlphaGo把对手当做和自己一样的官子能力,所以不会考虑人类对手由于时间不足出现失误的情形,把对手想得太强硬生生把自己逼到绝路。
有一种简单的改进是对冒险策略的成功率做一个截断,比如低于20%能翻盘的落子直接放弃,避免臭棋,不过这可能不足以解决问题。
-------------------------------
最后一个问题,AI是不是还是天下第一的阿老师。
我觉得还是。
想逼出AI在劣势下的策略问题的话,首先得有能力将AI打到劣势。
要想将稳如狗的AI从平局以上打到劣势没有任何取巧方法。只有比AI算得准,比AI算得快,能够算出某个AI算不出的变化才有可能。
以AI体现的正常布局战斗收官水平,想要在计算上赢过AI非常困难。
人的计算能力有限只能填宝贵的时间,而且必然没办法穷尽变化。
这次李世石下出了神来之笔,非常不容易。
但是到了下一局,谁能保证场面上还能有这样可遇不可求的手筋呢?
谁又能保证人脑竭尽心力推算几十步以后的变化不出错呢?
等到下下局,AI要是加入了看对手的用时调整自身用时的规则怎么办?
下下下局,AI还会保留着劣势下的策略bug吗?
-------------------------------
在所有人都不看好的不利局面下,李世石通过长考下出了78手挖的神之一手,把本来要死的棋逃了出来(明显连电脑都没算出来)。
下完这手之后,我看到李世石锐利的眼神再次出现了,那是「一生懸命」的大胜负师对局面机会特有的嗅觉。
是的,那个熟悉的“飞禽岛不败少年”又回来了。
我知道,计算机终有一天会全面碾压人类,但那又怎样,棋手们对“神之一手”的追求永远不会停止,这种执着代表了人类之所以存在的价值。
这就是围棋最大的魅力吧。
李世石“神之一手”击败alphago迎首胜(古力称这手棋是『神之一手』,佐为附体)
通过这四局棋完整的目睹了真实世界中的人类对于“全人类代表”态度转变的全过程。
在此之前只在科幻小说里读到过这个。
每场比赛开始前,李世石会依照常例向alphago的机箱鞠躬致敬,即使代alphago走棋的那个人没有任何表示也依然如此。
不愧是大胜负师。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有