14 小時訓練稱霸圍棋、西洋棋、將棋 Google 推出 AlphaGo 終極進化版「AlphaZero」

14 小時訓練稱霸圍棋、西洋棋、將棋 Google 推出 AlphaGo 終極進化版「AlphaZero」
▲AlphaZero 只花兩小時訓練,就勝過西洋棋 AI 冠軍。(圖/取自 Pixbay)

陳建鈞/綜合報導

AlphaGo 於 2017 年 5 月擊敗世界棋王柯潔,站上圍棋界巔峰,很多人以為 它的旅途將告一段落,卻沒料到這不過是 AlphaGo 的起點;繼前陣子推出 AlphaGo Zero 後,近日 Google 又發表更強悍的棋類 AI「AlphaZero」,在合計 14 小時的訓練時間內,輕鬆稱霸圍棋、西洋棋、將棋三個領域。

根據《英國廣播公司》報導,AlphaZero 只花 8 小時訓練就擊敗勝過李世乭的 AlphaGo、2 小時完勝頂尖西洋棋 AI Stockfish 8、4 小時超越日本將棋 AI Elmo,連經過 3 天訓練的 AlphaGo Zero 也不是其對手。

▲曾擊敗韓國棋王的 AlphaGo,也不是 AlphaZero 的對手。(圖/翻攝自 The New Yorker)

西洋棋 AI 的研究,幾乎可說與人工智慧的發展一樣古老,早在 1997 年,由 IBM 開發的「深藍」就曾擊敗過西洋棋世界冠軍卡斯帕洛夫;Google 強調,此次挑戰的 Stockfish 8 是 2016 年 Top Chess Engine Championship 世界冠軍。

AlphaZero 與 Stockfish 8 兩方分執先後手各 50 場,進行共 100 場的對決,AlphaZero 先手時贏得 25 場比賽,後手時贏得 3 場比賽,其餘場次則以和局作結,這意謂著 AlphaZero 在對決中未嘗一敗。

「我一直在想,如果比人類更聰明的外星人降落到地球上,教人們下棋會是個怎麼樣的情況。」頂尖西洋棋手彼得.海涅.尼爾森表示,「現在我明白了。」

西洋棋以外,該論文指出,AlphaZero 也在 2 個小時的訓練後從日本將棋 AI「Elmo」手中奪得勝利;不只棋盤更大,任何吃掉的棋子都能以我方陣營的身份再次出場,也因此,將棋是種比西洋棋更複雜的棋類遊戲,將棋 AI 世界冠軍 Elmo 2017 年才剛剛從人類冠軍手中獲得勝利。

AlphaZero 與 Elmo 雙方以同樣的形式進行百場對決,其中 AlphaZero 取得 90 勝,以懸殊勝差擊敗對手;在與 AlphaGo Zero 的「內戰」中,也以些微差距領先 AlphaGo Zero 的表現。

儘管 AlphaZero 在棋盤上屢屢取勝,可說打遍天下無敵手,仍距離現實上的應用還有段差距,畢竟,現實世界變動多端,不可預料性完全無法比擬,唯一能肯定的是,棋盤只是 AI 的起始點,未來它們將繼續前行,開創人類前所未見的可能性。

延伸閱讀

留言