影/威利在那裡!這隻機器人眼睛超犀利 靠 AI 4.5 秒找出畫中威利

影/威利在那裡!這隻機器人眼睛超犀利 靠 AI 4.5 秒找出畫中威利
▲機器人能在幾秒內,從人山人海的畫面,揪出威利所在。(圖/翻攝自 Youtube)

陳建鈞/綜合報導

《威利在哪裡?》是陪伴許多人度過童年時光的繪本,要從那人山人海的場景中,找出真正的威利,可真是一件費時的困難工作;不過,外國打造出一台名為「威利在那裡」(There's Waldo)機器人,能在 4.5 秒內指出威利位置,讓尋找威利再也不困難。

▲透過機器學習技術,要找出威利再也不困難。(影片/取自 YouTube,若遭移除請見諒)

首先,簡單介紹一下《威利在哪裡?》;這是一系列由英國插畫家 Martin Handford 創作的兒童繪本,讀者唯一的任務就是從極其複雜、人多的像螞蟻的畫面中,依據威利的裝扮、長相,找出真正的威利在哪裡。

尋找威利要求讀者毅力、眼力兼具,許多讀者可能在找出威利的位置前,就氣餒地想先提早幫他辦理失蹤人口了;但在機器人與 AI 的助力下,要從複雜的場景裡鎖定威利位置,再也不是件苦差事。

這台堪稱「威利殺手」的機器人,由美國廣告公司 Redpepper 製作,擁有一隻由樹莓派電腦控制的機械手臂,並配備一個具有臉部辨識功能的鏡頭;當機器人拍攝下《威利在哪裡?》的頁面圖畫後,會立刻運用電腦視覺庫 OpenCV 比對威利長相,再透過機器學習工具 Google AutoML Vision 分析,找出位置。

▲利用機器學習技術,機器人可在短短數秒內找到威利真正的位置。

當機器人認為可信度超過 95% 時,便會指出圖畫中的威利位置,通常整個過程只有短短幾秒鐘。

根據《The Verge》報導,負責該項目的技術人員 Matt Reed 透露,他利用 Google 圖片蒐集了 62 張威利大頭照,以及 45 張威利全身照,雖然這數量以機器學習的數據庫來說並不算多,但就結果而言,可相當準確地指出威利位置。

Reed 提到,開發這台機器人靈感,源自亞馬遜臉部辨識技術「Rekognition」的名人識別功能,想要打造一個用於卡通的版本;在此之前,他從未接觸過 Google AutoML,並花了整整一週用 Python 編寫機器人程式。

Redpepper 在影片描述中表示,目前機器人僅須花費 4.45 秒,就能人山人海的繪畫中,指出真正的威利位置,這速度比絕大多數的 5 歲孩童要快;人類要跟機器人在這方面競速,恐怕是贏不了的。

▲找到威利後,機器人會用機械手臂上的假手觸碰威利位置。

但是,雖然尋找威利是一件讓人抓狂的苦差事,讀者們購買這本書,不就是要體驗壓抑心中的煩躁,克服百般想放棄的衝動,耐著性子最終找到威利的滿足感與醍醐味嗎?

留言

延伸閱讀