【 CES 2018 】國際消費電子展最受矚目:人工智慧 & 語音功能

【 CES 2018 】國際消費電子展最受矚目:人工智慧 & 語音功能

▲ Bosch 開發 “ 自然語言 ” 車內語音輔助系統(圖/翻攝自 Bosch )

【原文:《人工智能+語音引爆CES 2018》,作者:Junko Yoshida,智慧機器人網編輯整理】

 

文、圖/雷鋒網

在今年的國際消費電子展 ( CES 2018 ) 上,語音 ( voice ) 、連接 ( connectivity ) 和人工智能 ( AI ) 成為最受關注的焦點。如果說今年的 CES 能為我們帶來什麼指標,那麼這三項建構模塊將是組成 2018 年及未來消費電子設備缺一不可的神聖“ 三位一體 ”。

 

語音助理已經準備好進入穿戴式設備、耳機、嬰兒監視器、燈具、電視遙控器和車輛。 DSP Concepts 創始人兼首席技術官 Paul Beckmann 在接受《EE Times》時說:「我們似乎正見證著一場圍繞著語音的 ' 寒武紀大爆發 ' 。」

 

▲ DSP Concepts 首席技術官 Paul Beckmann(圖/翻攝自雷鋒網)

在 CES 上,被稱為“中國Google ”的百度大力向開發商展示並開放其基於 Duer OS 的平台。無論是其聲控檯燈或掛在天花板上的投影機和螢幕,都不需要 Alexa 或 Google Assist 。就像百度常掛在嘴邊的“中國速度”,越來越多的廠商開始朝向語音發展。

▲百度展示了一款整合檯燈功能的聲控智能喇叭(圖/翻攝自 Baidu )

 

消費設備必須具備連接能力已經是不爭的事實。 Silicon Labs 首席執行官 Tyson Tuttle 強調,接下來的必備功能是“ 混搭 ”不同的無線網絡。他解釋說,直接將原本為智能型手機設計的連接芯片加進物聯網(IoT)設備,已經無法滿足要求了。系統需要動態的多協議軟件,以及為不同的無線網絡劃分時間的能力。

 

儘管 AI 在高度自動化汽車中佔據主導地位,但 Ceva 首席執行官 Gideon Wertheizer 告訴我們:「我看到 AI 開始擺脫幻想世界。」供貨商如今正試著「設置參數,在隨機環境中使用 AI 來解決特定問題。」

▲ Ceva 首席執行官 Gideon Wertheizer(圖/翻攝自雷鋒網)

 

換句話說,許多公司開始學習在小規模應用中導入 AI ,並將其用於特定任務,而非依靠 AI 來解決世界上的問題。

 

語音隨車上路

無論是在家庭或開車行駛中,語音都將至關重要。

博世(Robert Bosch)在 CES 宣布計劃將其語音助理設計在方向盤後方。博世管理董事會成員 Dirk Hoheisel 表示:「我們正致力於讓駕駛艙內的按鈕亂象劃下句點。」 Elektrobit 在 CES 上承諾,該公司將成為亞馬遜(Amazon) Alexa 的第一批汽車軟體整合商之一。

▲ Bosch 開發 “ 自然語言 ” 車內語音輔助系統(圖/翻攝自 Bosch )

百度宣布其基於 Duer OS 的Apollo 2.0平台被稱為“自動車輛的Android ”,並稱語音輔助系統將成為該平台的一部份。百度總裁兼COO陸奇表示:「家庭與車輛之間已經不存在界限了。無論你在家中做什麼,應該也都可以在車子裡實現。」

Wertheizer 則指出,無論是在家中還是車內,隔離聲音以及直接向雲端發送清晰的訊號都非常困難。“我們的周遭充斥著噪音和噪聲著。”很自然地,家庭和汽車的解決方案必須能夠因應一連串完全不同的嘈雜環境。

 

語音算法缺少標準

讓問題變得更複雜的原因在於業界還沒有任何標準的語音算法。 Wertheizer 表示:「每一家公司都有自家處理語音的專有算法。」

系統業者開始求助於學術界發表的技術論文,競相找出如何最有效隔離語音的解決之道。而當他們使用不同的麥克風和揚聲器類型時,還必須優化其算法,以因應不同的設置要求。

而在 Ceva , Wertheizer 說:「我們必須建立一個類似原子庇護所的工作室,用於研究所有的選擇,並開發波束成形、遠場和近場、迴聲消除和環境降噪等算法。」

Beckman 也呼應了這個觀點。就像人們喜歡語音作為自然的用戶接口一樣,他說:「遺憾的是,對於實際執行的產品設計人員來說,它是最具挑戰的技術之一。」他已經看到了太多的語音項目出錯了,最終得回到草圖階段重新開始。

Beckman 曾經在 Bose Corp. 擔任研究工程師長達 9 年,在 2000 年初成立了他的諮詢業務。當他與客戶討論語音項目時,他發現業界需要一套有效執行的“完整軟件解決方案,以及能為其實現差異化的底層技術”。但是,最主要的關鍵在於賦予其能夠自行調整系統的能力。

隨著語音市場爆發, Beckman 的業務也隨之成長。 DSP Concepts 不再只是一家諮詢公司,現在還提供了一套完整的算法作為軟體庫和除錯工具,有助於客戶調整系統。 Beckman 說:「我們提供調整、整合和驗證工具。」

▲語音UI解決方案需要一套完整的算法(圖/翻攝自 DSP Concepts )

DSP Concepts 的語音用戶接口(UI)技術稱為 Audio Weaver ,它是第一家獲得亞馬遜(Amazon) Alexa 產品認證的第三方軟體公司。 DSP Concepts 聯合創始人兼首席執行官 Chin Beckmann 展示一款 Audio Weaver 語音助理產品——相較於亞馬遜 Echo 使用了 7 支麥克風, Audio Weaver 僅用了 2 支麥克風,據稱就能夠“聽”得比 Echo 或 Google Home 更清楚。

 

在邊緣實現AI

Wertheizer 說,隔離語音是第一步,但接下來還有其他步驟:語音助理必須辨識語音的位置,而且必須能夠追踪語音。而且,它必須能偵測以及辨識誰在房間裡說話。

直到最近,雲端才剛被認為是處理和學習的地方。如今,這個假設將在 2018 年發生改變。

Wertheizer 解釋說:「我看到人們對於 AI 的態度越來越務實。他們希望在邊緣設備執行 AI 而非在雲端進行,以避免隱私、延遲和成本等問題。」

聯發科技(MedaTek)財務長顧大為對此表示認同。相較於亞馬遜在其 Echo 中推動雲端到雲端的服務,聯發科看到了“邊緣和雲端”融合模式的可能性。他在 CES 時告訴我們,語音助理競賽如今已經著重於在本地增加“智能”、區別人類與非人類的聲音分開、消除背景音樂、辨識聲音模式等。

 

▲Petcube Wi-Fi寵物照相在遠程進行機監測並與寵物互動(圖/翻攝自 Petcube )

 

Wertheizer 說:「以 Petcube 設計的交互式 Wi-Fi 寵物相機為例,它能在主人不在家時,通過雙向音訊和 1080p 高解析 ( HD ) 視訊攝影機進行監控,以及與狗或貓互動。」 Wertheizer 說:「我不確定 Petcube 是否意識到這是一家物聯網公司。但是,像這樣的連網產品中,語音識別系統顯然必須能夠辨識狗吠聲,並且確定狗是處於壓力還是處於危機之中。換句話說,系統需要有智能才能進行學習。」

 

Neupro 低功耗 AI 處理器

雖然 Ceva 為語音系統的設計者提供了名為 ClearVox 的語音算法,但它也知道系統廠商需要的更多。系統製造商希望在其物聯網設備中整合學習和推論的能力,使其產品能夠持續變得更加智慧化。

 

目前的市場上亟需 AI 處理器。為了滿足這一需求, Ceva 在 CES 上推出了 NuePro ,這是一款“專用的低功耗AI處理器系列,用於在邊緣進行深度學習”。 NuePro 是一款獨立的專用 AI 處理器,可廣泛用於物聯網、智能型手機、安全監控、汽車、機器人、醫療和工業等市場。

▲ Ceva 推出 AI 處理器(圖/翻攝自 Ceva )

 

值得注意的是, Ceva 並非深度學習領域的新手。據報導, NeuPro 是以 Ceva 在計算機視覺應用深層神經網絡方面的經驗為基礎。

Wertheizer 說, NeuPro AI 處理器是 Ceva 從頭開始研發的第一款“非DSP ”技術。他在發布 Neupro 時說:「我有點緊張。但是你必須知道 AI 並不是訊號處理方面的問題。」

NeuPro 處理器搭載兩個硬體—— NeuPro 引擎和 NeuPro VPU (向量處理單元)。 Wertheizer 指出,雖然引擎處理定義良好的人工智能算法,如 CNN 、啟動和規範層,但是,可程序設計的向量引擎 NeuPro VPU 是執行專有 AI 算法的一種延伸。“我們選擇了這種硬聯機的建置方式,而不是使用GPU或CPU,讓我們能夠增加AI處理器的利用率。”

Ceva 聲稱,這款新的專用 AI 處理器系列帶來了“相當高的性能提升,從入門級處理器的 2TOPS 到為最高階配置的 12.5TOPS  ”。

▲NeuPro硬件模塊;Ceva首席執行官Gideon Wertheizer強調,“ NeuPro VPU和NeuPro引擎之間的無縫切換至關重要,”。(圖/翻攝自 Ceva )

Ceva 表示, NeuPro AI 處理器將於 2018 年第二季向客戶提供授權,併計劃在第三季全面發布。

同樣地,聯發科準備推出一款由意騰科技(Intelligo Technology)設計的 AI 處理器和算法。 Intelligo 是 2016 年時從聯發科獨立而出的新創公司。

Intelligo 設計的這款 AI SoC 被稱為“智能DNN語音處理器”應用範圍較有限。聯發科表示,該處理器提供“可配置的深度神經網絡和高效率推論引擎(每秒每瓦特1 TOPS運算性能)”。

顧大為表示,聯發科正在尋找一種小型的 AI 加速器,為辨識 20 到 30 個關鍵詞而設計。另一方面,聯發科也正推廣其“分佈式處理”的觀念,期望語音和 AI 功能不只是整合於像 Echo 或 Google Home 的智能音箱,而是更落實於廣泛的小型設備 —— 如電燈開關。

【原文:《人工智能+語音引爆CES 2018》,作者:Junko Yoshida,智慧機器人網編輯整理】

熱門標籤

留言

延伸閱讀