影/微軟AI用150個分身挑戰《小精靈》遊戲 獲999,900滿分破關

影/微軟AI用150個分身挑戰《小精靈》遊戲 獲999,900滿分破關

▲微軟Maluuba團隊設計了一種名為「混合式獎賞架構」(Hybrid Reward Architecture)的策略,Maluuba將其任務作劃分,它使用150多隻分身代理的小精靈(agent),每隻分身會各自被分配一個特定任務。(圖/翻攝自YouTube)

編譯張岑宇/綜合外電報導

微軟在2017年收購一家深度學習(deep learning)新創公司Maluuba,利用人工智慧(AI)技術,讓AI化身為150多個分身,挑戰小精靈遊戲(Ms. Pac-Man),順利破關,取得最高分999,900分。

▲微軟讓AI化身為150多個分身,挑戰小精靈遊戲(Ms. Pac-Man),順利破關,取得最高分999,900分。(影片/取自YouTube,若遭移除請見諒)

《小精靈》是80年代紅白機上相當受歡迎的遊戲,不少567年級生都有玩過,小精靈要在迷宮中盡可能吃下白豆子拿分,但又要避免4大幽靈的追趕。日後甚至有電影《世界大對戰》(Pixels)以此遊戲當作背景,在電影裡《小精靈》Pac-Man設定為紐約大戰中的主要敵人,被小精靈咬過的東西都會變成像素。

▲電影《世界大對戰》(Pixels)以此遊戲當作背景,在電影裡《小精靈》Pac-Man設定為紐約大戰中的主要敵人,被小精靈咬過的東西都會變成像素。(影片/取自YouTube,若遭移除請見諒)

根據《Tech chrunch》網站報導,因為此遊戲變化多端相當難打,因而成為許多AI界人士挑戰的目標。因此微軟Maluuba團隊設計了一種名為「混合式獎賞架構」(Hybrid Reward Architecture)的策略,Maluuba將其任務作劃分,它使用150多隻分身代理的小精靈(agent),每隻分身會各自被分配一個特定任務。

舉例來說,像是有些專吃大力丸,另外一些負責躲避幽靈。此外,並設計出一個類似負責下決策的頭頭大精靈(top agent),可收集所有分身精靈建議,做出最佳判斷。例如,100隻小精靈想吃大力丸而向右跑,3隻小精靈為了躲避幽靈而向左跑,則大精靈會分析評估,給發現幽靈且向左跑的精靈比較高的決策加權值。

由於遊戲當初創立的主要目的,是為了使能夠玩家不斷掏出硬幣繼續玩下去,所以開發商當初將一種無法預測的元素加入遊戲,因此遊戲規則相當變化多端所以遊戲亦成為測試人工智慧的最佳環境。研究人員指出,每隻精靈都在自利前提下行動,而大精靈決策考量整體利益的情況下,能拿到最高分。 

此外,Google在2017年4月1日為愚人節慶祝活動,也曾推出《小精靈》遊戲和Google Maps一起合作,但當時人類最高紀錄只有266,330分,與微軟的AI至今破獲的滿分相差甚遠。 

Maluuba的CTO Kaheer Suleman解釋,「將事情分解成較小問題的想法,是人類解決問題的基礎。」「可以把這個遊戲作戰策略應用在做產品開發的公司上就是個很好的例子。像是整個組織的共同的最大目標是開發一個產品,但是分身小精靈就像是團體內有一些比較小的組織。需要特定的回報和目標去完成。

值得一提的是,微軟可望藉由今次 Maluuba 的成功,能夠透過人工智慧的進一步發展,未來可望用於協助高層進行商業決定,並且預測公司的銷售目標。

延伸閱讀

留言