围棋和人类不是我的尽头——AlphaZero

在各种棋类都能打败人类之后, DeepMind终于把目光投向了那些战胜过人类的同类.

昨天, AlphaGo 研究团队提出了 AlphaZero: 一种可以从零开始, 通过自我对弈强化学习在多种任务上达到超越人类水平的新算法.

那AlphaZero到底有多厉害呢:

8 个小时训练击败李世石版本AlphaGo

12 小时训练击败世界顶级的国际象棋程序 Stockfish

14小时训练击败世界顶级将棋程序 Elmo

就算是面对强大的AlphaGo Zero, AlphaZero在训练34小时后, 也战胜了训练72小时的前者. 对, 细心的朋友可能已经发现其实二者就差了一个 'Go' , 那是因为DeepMind认为最新的AlphaZero已经超越了围棋这个界限, 所以去掉了作为代表的 'Go' .

面对这种全棋种制霸的AI小编只想说, 以后各位有了孩子, 就别往职业棋手方向培养了吧. . .


在各种棋类都能打败人类之后, DeepMind终于把目光投向了那些战胜过人类的同类.

昨天, AlphaGo 研究团队提出了 AlphaZero: 一种可以从零开始, 通过自我对弈强化学习在多种任务上达到超越人类水平的新算法.

那AlphaZero到底有多厉害呢:

8 个小时训练击败李世石版本AlphaGo

12 小时训练击败世界顶级的国际象棋程序 Stockfish

14小时训练击败世界顶级将棋程序 Elmo

就算是面对强大的AlphaGo Zero, AlphaZero在训练34小时后, 也战胜了训练72小时的前者. 对, 细心的朋友可能已经发现其实二者就差了一个 'Go' , 那是因为DeepMind认为最新的AlphaZero已经超越了围棋这个界限, 所以去掉了作为代表的 'Go' .

面对这种全棋种制霸的AI小编只想说, 以后各位有了孩子, 就别往职业棋手方向培养了吧. . .

2016 GoodChinaBrand | ICP: 12011751 | China Exports