棋类的解决框架一直都是基于 minimax + heuristic。以前围棋难是因为minimax在有着很大分支的游戏上无法产生足够的深度,并且heuristic难以设计。alphago zero时候就已经证明了cnn很适合做heuristic,而mcts也可以解决深度问题。
那为什么别人不做呢?
因为贫穷限制了我们的想象力。
有钱真的是可以为所欲为
下面是灵魂画手:
看这张图右下角的单位。你就知道为什么我们还在用alphabeta了。
正如我之前的文章说的,AI 时代正在来临。
上面评论都在感慨5000TPU1 的土豪。
但是,硬件的成本下降是非常快速的。5年后这个成本可能只在几十万美元了。
很多公司(国内+国外)在做类TPU的芯片,2018年将大面积推广,价格会大幅度下降。
5年后,1个TPU应该在100美元以下,谁都可以多核TPU插卡或者内核。