圍棋和人類不是我的盡頭——AlphaZero

在各種棋類都能打敗人類之後, DeepMind終於把目光投向了那些戰勝過人類的同類.

昨天, AlphaGo 研究團隊提出了 AlphaZero: 一種可以從零開始, 通過自我對弈強化學習在多種任務上達到超越人類水平的新演算法.

那AlphaZero到底有多厲害呢:

8 個小時訓練擊敗李世石版本AlphaGo

12 小時訓練擊敗世界頂級的國際象棋程序 Stockfish

14小時訓練擊敗世界頂級將棋程序 Elmo

就算是面對強大的AlphaGo Zero, AlphaZero在訓練34小時後, 也戰勝了訓練72小時的前者. 對, 細心的朋友可能已經發現其實二者就差了一個 'Go' , 那是因為DeepMind認為最新的AlphaZero已經超越了圍棋這個界限, 所以去掉了作為代表的 'Go' .

面對這種全棋種制霸的AI小編只想說, 以後各位有了孩子, 就別往職業棋手方向培養了吧. . .


在各種棋類都能打敗人類之後, DeepMind終於把目光投向了那些戰勝過人類的同類.

昨天, AlphaGo 研究團隊提出了 AlphaZero: 一種可以從零開始, 通過自我對弈強化學習在多種任務上達到超越人類水平的新演算法.

那AlphaZero到底有多厲害呢:

8 個小時訓練擊敗李世石版本AlphaGo

12 小時訓練擊敗世界頂級的國際象棋程序 Stockfish

14小時訓練擊敗世界頂級將棋程序 Elmo

就算是面對強大的AlphaGo Zero, AlphaZero在訓練34小時後, 也戰勝了訓練72小時的前者. 對, 細心的朋友可能已經發現其實二者就差了一個 'Go' , 那是因為DeepMind認為最新的AlphaZero已經超越了圍棋這個界限, 所以去掉了作為代表的 'Go' .

面對這種全棋種制霸的AI小編只想說, 以後各位有了孩子, 就別往職業棋手方向培養了吧. . .

2016 GoodChinaBrand | ICP: 12011751 | China Exports