百科问答小站 logo
百科问答小站 font logo



如何评价DeepMind新提出的MuZero算法? 第1页

  

user avatar   rewrgf 网友的相关建议: 
      

感觉没啥新的东西,他虽然声称rule-free,但实际上是去掉了判断禁入点,是否终局之类的那个simulator而已,最重要的胜负判断器并没有去掉,本来是禁入点是直接用simulator判掉不让你下,现在改成你下了就判负而已。

当然,胜负判断器去掉的话,也不可能下的出围棋了。但不去掉胜负判断,只去掉simulator,本质上也就是初期训练时候多几个step而已,稍微学了几个step之后model就能知道哪里是禁入点哪里不是了,然后就和原来的alphago master, alphago zero, alphazero什么的一样了。




  

相关话题

  如果不按套路下棋是不是就能赢 Alpha Go 了? 
  2021 年各家大厂的 AI Lab 现状如何? 
  2021年深度学习哪些方向比较新颖,处于上升期或者朝阳阶段,没那么饱和,比较有研究潜力? 
  关于材料计算,模拟,仿真什么区别? 
  如何评价科大讯飞AI学习机T10发布会,有哪些亮点和升级? 
  智能科技,会让孩子的创造力下降吗? 
  如何评价 DeepMind 新提出的关系网络(Relation Network)? 
  如何评价DeepMind新推出的用于训练通用智能体的XLand? 
  柯洁与 AlphaGo 三场皆负,对围棋今后的发展会有哪些影响? 
  柯洁对围棋的贡献有哪些? 

前一个讨论
如何看待帝国理工关于新冠变异种的第一份报告?
下一个讨论
如何看待台湾地区领导人开放含有莱克多巴胺的美猪,台湾人民能阻止的了吗?





© 2025-04-02 - tinynew.org. All Rights Reserved.
© 2025-04-02 - tinynew.org. 保留所有权利