【 CCF-GAIR 2018 】人工智慧互動新未來:多模態共享模式(下)

【 CCF-GAIR 2018 】人工智慧互動新未來:多模態共享模式(下)

▲多模態互動。(圖/翻攝自雷鋒網)

【原文:《德國漢堡科學院院士張建偉:人工智慧互動的未來是多模態共享模式 | CCF-GAIR 2018 》,作者:張莉,智慧機器人網編輯整理】

文、圖/雷鋒網

跨模態學習應用

張建偉認為,下一步的挑戰是我們如何把人工智慧用在這種物理系統裡頭,使得機器人和人工智慧的結合變得更加透明,運用到多模態的互動,如何使機器和人融到一塊,使得我們真正進入人類的 2.0 的時代。機器人未來和人工智慧互動的未來,不是單模態的,而是一個多模態共享的模式

▲機器人透過大數據學習,能夠模仿歌手唱他沒有唱過的歌。(圖/翻攝自雷鋒網)

張建偉介紹了他的團隊與清華大學、北京大學、北京師範大學和科學院心理所合作研究的人工智慧基礎研究項目—跨模態學習。共同研究跨模態學習的認知、計算和神經機制,利用理解的知識和模型,來提高人機互動的性能。 

這種跨模態和跨學科、跨文化的學習是這個項目的特點。如何實現混合的、可靠的智慧來融合各種各樣的感測器,包括類似視覺、聽覺、肢體感覺,還有一些人工的,像雷射雷達一樣的數據,人的模型提供了一個非常好的樣板。如何使用自上而下的控制,如何把數據驅動跟知識驅動融合到一塊,如何在數據融合方面不只是簡單的數據模型的疊加,而是有一個符號的表示,用它們來做決策,用互動和動作的執行,尤其是提高我們未來的人工智慧和機器人系統的效率和穩健性。

▲多模態互動。(圖/翻攝自雷鋒網)

他認為,我們現在更多的要關注神經成像的模型、神經激勵的方法、腦機介面,甚至心理學的行為學,來進行系統的合成,最後在機器人和複雜的 CTS 系統裡進行驗證。這裡面有三個重要的方向,一個叫跨模態的動態適應機制,例如,通過發現老鼠在學習前和學習後的神經元的變化,希望總結出未來更好的帶有局部記憶的深度神經模型。第二個領域是跨模態的泛化和預測,第三個是在未來的跨模態的人機互動方面,如何讓機器人通過視覺、語言的共同學習,更好地理解概念,理解他們中間的關係。

通過多模態的學習,包括未來的製藥、科學實驗,都可以通過機器人進行大量的加速,在機器人應用比較典型的瓶頸問題裡,通過多模態的學習實現了機器人的靈巧操作,包括抓取、注射等等。此外,張建偉還介紹了多模態學習技術在自動駕駛、行走機器人領域的應用。

▲跨模態學習。(圖/翻攝自雷鋒網)

會後,張建偉接受了《雷鋒網》的採訪,介紹了德國在人工智慧和機器人領域的發展情況。在人工智慧的基礎研究方面,近 20 年德國政府一直長期持續在資助。即使在人工智慧處於寒冬的時候,德國的科學研究會資助的很多大項目裡面,都包含很多人工智慧的元素,所以在人工智慧核心技術、人才方面都有很好的積累。

德國的研發題目不是由政府來設定,而是由科學家來定義未來的研究問題,這種模式是科學家主導。政府根據研究內容的前瞻性和內部評比來確定資助對象。所以,德國人工智慧和機器人的結合在科技理論上的創新程度一直很高,既有基礎研究項目,又具有很高的跨學科的特點。

另一方面,德國整個製造業的全面程度在全世界也比較領先。所以在德國的汽車公司裡,自動駕駛還有輔助安全駕駛,差不多近20年一直在長期投入。在真正的自動駕駛或者輔助駕駛的量產方面,德國的汽車公司還是可能會領先的,奧迪最近的 60 公里以下的自動駕駛車量產,在全球第一個真正實現了量產。德國提出工業 4.0 的概念,也是希望再把物聯網、人工智慧加入製造領域,來保持他們在製造和智慧結合方面的優勢。

總的來說,德國在人工智慧和機器人領域一方面積累了大量的基礎技術,另一方面在工業製造、醫療、駕駛領域一直保持持續的研發,即使在還沒有變成產品的時候,也積累了很多的核心技術,培養了很多人才。

熱門標籤

留言

延伸閱讀