從零開始下圍棋 AlphaGo Zero更加強大

美國時間10月18日, 《自然》雜誌在官網刊登了一篇名為《Mastering the game of Go without human knowledge》的論文. 該文章 (點我查看PDF ) 詳細介紹了DeepMind公司旗下人工智慧演算法AlphaGo Zero的特點.

AlphaGo Zero最厲害的地方在於, 它不需要人類專家的指導, 就能通過自我強化學習來進行訓練. 直白一點地說, 之前打敗圍棋大師李世石的AlphaGo可能需要人類給它提供各種高手棋譜來進行訓練, 而Zero就是一個完全的小白, 人類也不用教它什麼, 只需要告訴它規則, 它就能完全通過自學的方法來掌握圍棋.

和前代版本相比, Zero在效率上有著明顯的提升, 現在僅需要4塊TPU (由穀歌構建的專門的AI處理器) 和72個小時的訓練, 就能勝過之前幾個月訓練時間的AlphaGo.

根據DeepMind聯合創始人Demis Hassabis介紹, AlphaGo Zero的出現意味著, 現在他們可以向社會提供類似於科學研究的人工智慧引擎. 通過擺脫對人類的依賴, 這樣的演算法使得人工智慧在其他科學領域上的應用成為可能.


美國時間10月18日, 《自然》雜誌在官網刊登了一篇名為《Mastering the game of Go without human knowledge》的論文. 該文章 (點我查看PDF ) 詳細介紹了DeepMind公司旗下人工智慧演算法AlphaGo Zero的特點.

AlphaGo Zero最厲害的地方在於, 它不需要人類專家的指導, 就能通過自我強化學習來進行訓練. 直白一點地說, 之前打敗圍棋大師李世石的AlphaGo可能需要人類給它提供各種高手棋譜來進行訓練, 而Zero就是一個完全的小白, 人類也不用教它什麼, 只需要告訴它規則, 它就能完全通過自學的方法來掌握圍棋.

和前代版本相比, Zero在效率上有著明顯的提升, 現在僅需要4塊TPU (由穀歌構建的專門的AI處理器) 和72個小時的訓練, 就能勝過之前幾個月訓練時間的AlphaGo.

根據DeepMind聯合創始人Demis Hassabis介紹, AlphaGo Zero的出現意味著, 現在他們可以向社會提供類似於科學研究的人工智慧引擎. 通過擺脫對人類的依賴, 這樣的演算法使得人工智慧在其他科學領域上的應用成為可能.

2016 GoodChinaBrand | ICP: 12011751 | China Exports