影/MIT 用「群」訓練 AI 只練了 300 次就學會玩疊疊樂!

影/MIT 用「群」訓練 AI 只練了 300 次就學會玩疊疊樂!
▲AI 只練了 300 次就學會玩疊疊樂!(圖/翻攝自科技報橘)

【本文經合作夥伴《科技報橘》授權轉載,並同意《智慧機器人網》修訂標題,原文標題為《影/MIT 用「群」訓練 AI 只練了 300 次就學會玩疊疊樂!》,作者:郭家宏,《智慧機器人網》編輯整理】

文、圖/科技報橘

AI 已經能做很多事情,例如下圍棋、打牌、打新海爭霸,而且表現比人類好。現在, AI 又多了一項新技能:玩疊疊樂。

疊疊樂 AI 機器人,學會判斷「觸覺」

麻省理工學院(MIT)的科學家研發一款疊疊樂 AI 機器人。這款機器人有攝影機和力量感測器,可以感知疊疊樂的平衡狀態,並有兩根「手指」,用於推、抽、抓取,以及放置積木。

不同於圍棋和星海爭霸等純粹智慧的遊戲,疊疊樂還包含了「觸覺」的判斷,玩家需要感知抽積木時的疊疊樂平衡狀態,才能夠抽出正確的積木,放到正確的位置,避免疊疊樂倒塌。因此對 AI 來說,具備玩疊疊樂的能力,等於具備觸覺感知、物理模型建構,以及精細操作的能力,這些是 AlphaGo 等 AI 所沒有的技能。

用「群」的概念,提升 AI 學習效率

不同於傳統用大量數據訓練 AI 的方式,科學家用「群(cluster)」的方式,讓機器人大約玩了 300 次,就學會了疊疊樂。機器人將類似的感測結果和疊疊樂的平衡狀態分組,例如將不好移動的積木的感測數據分為一組,將容易移動的積木的感測數據分為一組,將疊疊樂倒塌前的行為數據分為一組,機器人就藉由這些分組數據開發模型,預測每個動作之下,疊疊樂會如何被影響。

該研究的主導者 Nima Fazeli 表示,這種訓練 AI 的方式是模仿人類的學習方式,它能提升 AI 的學習效率。人類學習玩疊疊樂時,會分辨好推和不好推的積木,而不是將所有的積木一視同仁,全部都「推推看」,這就是分群的概念,比試推全部的積木還要省時間。

雖然從影片上來看,機器人的表現和人類相當,但是機器人沒有情緒壓力,手不會抖,或許當疊疊樂疊到了「危險」的程度,機器人的表現就會超越人類玩家。

科學家表示,這款機器人的感測技術,可以應用在工業生產上,特別是那種需要精確感測的生產流程,例如手機組裝。或許幾年之後,這種 AI 不只是用來玩樂高,還可以用來蓋真的摩天大樓。

留言

延伸閱讀