AlphaGo 没有自己的棋风
因为mcts算法的缘故,招法具有一定的随机性,同分值的招数可能同时存在好几个。用时、规则不同等等下法也会变化。
AlphaGo 会犯错,但是犯的错目前看,由于大局方面实在太强大,在和顶尖高手对局中基本不影响胜负结果。
援引live 中我和 @范廷钰 九段讨论的结果,AlphaGo确实强大,但是确实有很多局部上的问题手,这一点不必神话。
AlphaGo犯错的方式有几种:
1,没有必要现在下的棋,立刻走。围棋界称为“俗手”,因为提早走会让自己以后的余地大大减少。
2,舍大取小,这一点在优势的收官阶段非常常见,一旦进入劣势就会疯狂体现(go 李第四局)。
之后的内容我会分门别类详细概括一下:
「棋风」是 “行棋风格” 的简称。
棋风是每个棋手由内而外呈现的招法整体。
可以说,过去的时代,大家非常喜欢给顶级棋手加一些棋风的描述,增加辨识度。
在二战之后,可以说当时每个顶尖棋手,都被描写的特点十足。
“剃刀”的坂田,非常锐利,局部作战计算精准见长,常有凶险招数直取要害。
之后坂田九段在对阵当时年轻的林海峰的时候,说“不可能有二十岁的名人”,之后被林海峰夺走了头衔。
“二枚腰”的林海峰,“二枚腰”一词来自于相扑,说的是腰身宽大不易被摔倒,仿佛有两个腰一般。林海峰九段棋风 厚实均衡,韧性极强 ,喜欢把对手的意图接受过来,最后一刻发力。
我们从强关联的词开始讲:流派、风格、特色 都是艺术中常见的归类方式。
『特色』强调显著不同的点。
“先生,您好,虎皮青椒炒肉丝拌薯片是我们的特色菜。”
『流派』则往往是风格较统一、体系化的。
(签名别具一格,宇宙流三个字非常写意)
“武宫正树九段的宇宙流可以说是非常具有视觉冲击力的,奔放自在,非常宏大。”
个人风格常常会随着阅历、训练等等因素发生变化,流派则常常被大家代指是一种会吸收转化其他风格、特色为己用,保持一致内在精神、外在形象的进阶产物。
说『风格』
风格是整体性呈现,由内而外,有代表性的面貌。对于每个棋手来说,风格是受自己的思维习惯,训练历程,内在品质深深影响的。
装修有:“极简主义”风格、“欧式复古”风格、“狂拽酷炫杀马特”风格……
(说了杀马特风格后面就突然不想再举例了,感觉忘了爱)
“ 意气骏爽,则文风清焉 ” 《文心雕龙》
有人最近传言说邻居李大头有不好的“脱鞋风格”。
“老李你怎么能每次 左脚右脚互相连蹬,每次回家非要先踹走自己的鞋呢?你这个人脱鞋的风格太奇怪了。”
这认真看就是不对的,这个脱鞋风格没有一点内在流露,也没有一个整体的外貌呈现。
除非说你是顺便练那个“梯云纵”的轻功?
所以这种懒出来的“风格”只能自封。
-------------------------------------------------------------------------------------------------
「棋风」对于每个棋手来说,是一种『路径依赖』。
对于艺术性较强的领域,比如文学、绘画。
1,比如王二写小说,写到
“今天王二在街上遛弯,突然对大街上的骆驼们有了XXX 一般的情愫。”
这里用什么词见仁见智。
所以文学家们都会琢磨一套自己的风格,驾驭熟练了,写起来非常自如。
2,比如张大斗画画,琢磨着头皮和脚趾头应该是什么颜色。
这里用什么颜色,什么笔触,没有一定之规,也是画家自己决定。
——————————————————————————————
围棋随着计算、推理的深入,每一步的好坏可以越来越清楚地判断出来,围棋的不确定性不同于艺术领域,是有好坏标准的。
围棋的判断标准,在近几十年完善的非常快,可信度也越来越高。
从源头上我们可以说这样的路径依赖来自于过去的训练,习惯了这样去思考,习惯了先朝这里走一手,习惯了用这样的连贯招式去定型。
我们每个人提高的过程首先是学习前人经验的过程,拿前人最好的知识精华来“投喂”自己,通过死活等手段训练肌肉记忆,就像功夫熊猫里面每一个master那样。
———————————————————————————————
关于棋风背后的模式化
10年的 ted有一篇非常经典的演讲,关于思考模式,关于“ The pattern behind self-deception ”
文章里对人的 思维倾向常见的问题做了一个二分法:
I call this process "patternicity" — that is, the tendency to find meaningful patterns in both meaningful and meaningless noise. When we do this process, we make two types of errors. A Type I error, or false positive, is believing a pattern is real when it's not. Our second type of error is a false negative. A Type II error is not believing a pattern is real when it is. So let's do a thought experiment. You are a hominid three million years ago walking on the plains of Africa. Your name is Lucy, okay? And you hear a rustle in the grass. Is it a dangerous predator, or is it just the wind? Your next decision could be the most important one of your life. Well, if you think that the rustle in the grass is a dangerous predator and it turns out it's just the wind, you've made an error in cognition, made a Type I error, false positive. But no harm. You just move away. You're more cautious. You're more vigilant. On the other hand, if you believe that the rustle in the grass is just the wind, and it turns out it's a dangerous predator, you're lunch. You've just won a Darwin award. You've been taken out of the gene pool.
第一类是 false positive ,事物之间没有联系的时候倾向于认为有联系,“宁可信其有不可信其无”。(也是迷信的主要原因)
比如王不二有一天说了这么一句:“那天我摔了一跤,然后耳边响起了风声,那一定是周围空气里的小恶魔们嘲笑我飞来飞去~ ”
第二类是 false negative,有关联的情况下更愿意相信“其实没有联系”。
比如李大头有这么一句:“爱乱扔东西和我自律不自律一点关系都没有,这是我的本能”
原文里面的例子非常踏实,有一天你在丛林里走,听到一阵异响,你是倾向于相信有危险做防备撤离开还是大大咧咧继续走下去?
总之,万一确实是危险的捕食者,你就完了。
所以人们常常愿意说“宁可信其有不可信其无”,来自于古老的生存本能,我们可以常见各种“危机论者”,有备无患准备很多东西,但是大家还愿意效仿。因为那些 什么都不愿意提早做准备,相信什么都不会发生的往往会早早被突发事件干掉。
if you believe that the rustle in the grass is just the wind, and it turns out it's a dangerous predator, you're lunch. You've just won a Darwin award. You've been taken out of the gene pool.
Darwin Award, 被移出进化的链条里,啧啧。
————————————————————————————————————
几年来我和很多棋手聊过棋风的问题,发现很多高手并不认可自己被媒体总结的棋风,还是更愿意以因地制宜来形容自己。
艺术性的方向的发展会越来越展示自我,胜负向的则会非常明显的调和一个人的各个方面。
现代顶尖棋手,棋风更加多变,以研究清晰的变化为先,计算清楚的招法为准,发挥个人风格越来越淡。
当时邀请 @范廷钰 九段的时候,我说一句话形容自己,你会怎么说,范九段写了四个子在自己的个人介绍里:
人生如棋
感慨颇深。
AlphaGo 有很多错误,但是目前只有李世石与AlphaGo的第四盘因此影响了胜负
前面说AlphaGo两种常见错误方式:
【1.俗手】
白棋66扳出,是标注的俗手,这一扳可以确定随时都能和67外扳交换。现在没有必要下,会减少自己的余地,这样的棋AlphaGo较多出现。
【2.判断失误】
这里白棋154的扳是明显的失误,黑棋155本身就很有价值,后手挖吃两子,之后差距缩小。
【低级失误】
AlphaGo收官也有一些非常低级的失误,明显是算法在处理复杂的收官还是有一些问题。
这是取材自之前化名 master{P} 大杀四方时期对阵若水云寒(P)的对局,白棋下边被打吃的时候白棋不接上选择了246 打吃,被提掉之后由于之前在拼命地卖劫财,导致亏损。
AlphaGo 基于具有一定随机性的算法做出决定,没有棋风。
AlphaGo仍然有很多明显的错误,大局观取胜,确实有重剑无锋一般的感觉。
欢迎大家继续支持我和 @范廷钰 九段全程对局解析:
和职业九段一起看懂柯洁对战AlphaGo(这次参与的听众素质都非常高,范九段也非常有积极性与大家一起探讨,回答疑问。)