大名鼎鼎的AlphaGo Zero想必大家都知道,而最近它的研發(fā)團隊DeepMind發(fā)表了新論文,提出了全新的強化學習算法AlphaZero,它將在多種任務上達到超越人類的水平。
AlphaZero的開發(fā)團隊DeepMind
AlphaZero與AlphaGo Zero相比,不僅只是少了“Go”這么簡單,具體來說,它將能夠做到8個小時訓練擊敗李世石版本AlphaGo,12小時訓練擊敗世界頂級的國際象棋程序 Stockfish,美國云服務器 江西電信服務器,14小時訓練擊敗世界頂級將棋程序Elmo,即使是強大的AlphaGo Zero也已不是它的對手,在接受34小時訓練后,即可戰(zhàn)勝受訓72小時的AlphaGo Zero,美國服務器租用 美國站群服務器,這種強大的自我學習能力堪稱恐怖。
學習能力統(tǒng)計
如今,機器學習能力已越來越強大,不知職業(yè)棋手們的心理陰影面積會有多大,從中也可以預見的事,未來在部分領域人工智能將取代人類已板上釘釘。