百科问答小站 logo
百科问答小站 font logo



如何评价AlphaGo Zero? 第1页

  

user avatar   xie-dan-9 网友的相关建议: 
      

成神了。

之前的估值和策略合并,这是合理的。

rollout 和蒙地卡罗 本来就是同样的,只是为了快速采用快速走子,这个合并很明显的选择。

简单说,这个论文就是把以前人工干预的东西全部合并入新的体系,数学上学术上可以算完美版了。

三天超越alphago ,可见速度+算法+数据的厉害,人类历史的三千年智慧只等于TPU的三天。


建议:Alphago Zero 对人类历史的所有棋谱进行一次遍历。找出那些10+%胜率变化的妙招和败招,一则可以统计下人类的妙手发生率(特别是造成比Alphago Zero 还好的妙招)。基本上看看人类历史上有多少手超越Alphago Zero 的招数,看看人类做为一个整体,是否还有用。


顺便看看围棋的历史,到底是能力为王还是传承为王,这个是围棋文化的一个历史课题啊。


另外说说棋力:

Zero 对master 90% 胜率,这在围棋中基本是让两子的差距了。

Zero 对 alphagoLee 100% 胜率,这是三子以上四子的差距了。

反过来可以推,master 对 alphagoLee 让三子很正常。柯洁当时该让三子试试,发挥下人类的余热啊。




  

相关话题

  下围棋时对面直接打你一个角地怎么办,你下别的地方他也跟着打你,给我黑先还是觉得好恶心,本人刚入门两周? 
  训练过程中loss震荡特别严重,可能是什么问题? 
  下围棋时,下的不细腻是什么?感觉自己似懂非懂,有大佬详细讲解吗? 
  如何看待谷歌研究人员提出的卷积正则化方法「DropBlock」? 
  顶尖围棋女棋手比顶尖围棋男棋手差得多,把原因归结为是因为围棋女棋手人数少,为什么是错误的? 
  《银翼杀手 2049》里,对 K 的 Baseline Test 是一个怎样的测试? 
  adversarial training为什么会起作用? 
  阿尔法狗让你100子,你会怎么下? 
  大脑的本质就是一个 CPU 吗? 
  机器学习中的 Bias(偏差)、Error(误差)、Variance(方差)有什么区别和联系? 

前一个讨论
怎么评价梁孟松加入中芯国际?
下一个讨论
如何看待百度搜索「自杀」的时候提示的画面?





© 2025-01-13 - tinynew.org. All Rights Reserved.
© 2025-01-13 - tinynew.org. 保留所有权利