百科问答小站 logo
百科问答小站 font logo



如何评价DeepMind新提出的MuZero算法? 第1页

  

user avatar   rewrgf 网友的相关建议: 
      

感觉没啥新的东西,他虽然声称rule-free,但实际上是去掉了判断禁入点,是否终局之类的那个simulator而已,最重要的胜负判断器并没有去掉,本来是禁入点是直接用simulator判掉不让你下,现在改成你下了就判负而已。

当然,胜负判断器去掉的话,也不可能下的出围棋了。但不去掉胜负判断,只去掉simulator,本质上也就是初期训练时候多几个step而已,稍微学了几个step之后model就能知道哪里是禁入点哪里不是了,然后就和原来的alphago master, alphago zero, alphazero什么的一样了。




  

相关话题

  刚学围棋不久,请问扭羊头是不礼貌的吗? 
  如果统治中国区域的是一个AI,它会怎么处理台湾问题? 
  同样是做强化学习和AI,为什么华为诺亚方舟实验室做出的成果远不及DeepMind和OpenAI? 
  对于技术岗位而言,开发岗累还是算法岗累呢? 
  你见过最妙的围棋死活题是哪个? 
  如何评价微软创造出的麻将 AI? 
  如何用简单易懂的例子解释隐马尔可夫模型? 
  人工智能相关的岗位薪酬状况如何? 
  如何评价 Face++ 旷视科技最新出品的检测专用 backbone 网络 DetNet ? 
  adversarial training为什么会起作用? 

前一个讨论
如何看待帝国理工关于新冠变异种的第一份报告?
下一个讨论
如何看待台湾地区领导人开放含有莱克多巴胺的美猪,台湾人民能阻止的了吗?





© 2025-03-26 - tinynew.org. All Rights Reserved.
© 2025-03-26 - tinynew.org. 保留所有权利