影/看你多聰明!Google設下「囚徒困境」 讓AI對抗AI

影/看你多聰明!Google設下「囚徒困境」  讓AI對抗AI

▲Gathering遊戲進行畫面。(圖/翻攝自YouTube)

編譯張岑宇/綜合外電報導

Google旗下的人工智能公司DeepMind,近日為了研究AI系統行為模式,參考「囚徒困境」理論,設計了2個遊戲,讓 AI 對抗 AI;研究發現,AI會根據不同的情境選擇合作或競爭,並依遊戲規則改變行為,多數情況下,AI傾向互相合作。

這兩款遊戲分別是收集蘋果比賽「Gathering」、獵捕遊戲「Wolfpack」。第一款是回合制收集蘋果比賽「Gathering」中,玩法是必須採集到越多的蘋果越好,玩家能以雷射光束攻擊對方,讓另一名玩家暫時退出遊戲,替自己爭取更多採蘋果的時間。

「Gathering」結果顯示,若蘋果數量充足,則 AI 彼此相安無事,各自收集愈多蘋果愈好;但若蘋果數量減少,彼此攻擊頻率會增加。有趣的是,若研究者提高某一AI 的計算能力,則不論蘋果數量多少,該 AI 的攻擊頻率也會大幅增加,這並不代表能力愈高的 AI 就愈有攻擊性,因為攻擊會耗費運算資源。

▲收集蘋果比賽「Gathering」。(影片/取自YouTube,若遭移除請見諒)

而第二款獵捕遊戲「Wolfpack」中,遊戲中兩名玩家必須合作,追捕另一隻由電腦系統控制的狼,且不單只有抓到狼的玩家可以獲勝,連帶附近的玩家也能一起得分。而若只有一名玩家抓到狼,則有被拾荒者搶走狼的風險。

▲獵捕遊戲「Wolfpack」。(影片/取自YouTube,若遭移除請見諒)

「Wolfpack」結果顯示,AI要在障礙物之間捕捉獵物,除了抓到獵物可以得分,2位玩家在距離很近的情況下,只要有1位玩家抓到獵物,2位玩家都可以得分,雙方處於共贏的關係;研究發現,運算能力愈強的AI,更傾向於和對手合作捕捉獵物。

總結2個不同的實驗,研究人員認為AI可以根據不同遊戲規則,跟人類一樣隨機應變,會選擇最有利的情況改變行為。如果這些規則獎勵侵略行為,如攻擊他者可替自己獲勝機會大增,AI就會更積極去攻擊。反之,假如遊戲規則可透過合作達成共贏,AI就會選擇與其合作。

留言

延伸閱讀