一次看完微軟人工智慧走向及產品!小冰技能提升 能陪伴、關心用戶(上)

一次看完微軟人工智慧走向及產品!小冰技能提升 能陪伴、關心用戶(上)

▲一次看完微軟人工智慧走向及產品!(圖/翻攝自雷鋒網,下同)

【原文:《一口氣看完微軟人工智慧佈局和產品落地| 微軟2018人工智慧大會》,作者:李詩,智慧機器人網編輯整理】

文、圖/雷鋒網

目前,微軟、Google、亞馬遜、蘋果、Facebook 等巨頭都在佈局人工智慧,將人工智慧作為公司全面發展戰略,涉及方方面面,不花費一通功夫,很難一下子了解各大公司的技術、佈局和產品落地。

今天,在北京召開的微軟 2018 人工智慧大會上,微軟把自家做的事一股腦全說了。

在雷鋒看來,發布會的兩點主要有:微軟著重強調了其新的「世界觀」:智慧雲和智慧邊緣;展示了微軟在語音語義、視覺、機器翻譯的多項技術;微軟發布 ONNX 項目及 ML.NET 打造開源跨平台人工智慧開發框架;搭載著全新的「全雙工語音技術」的微軟小冰帶來了原創詩歌、歌曲和兒童故事;中國移動、大疆、唯品會、小米生態鏈分別展示了與微軟人工智慧的合作成果。

微軟新世界觀:智慧雲和智慧邊緣

雲計算、物聯網、大數據、人工智慧正在將我們的世界將變成一台巨大的計算機。

微軟全球執行副總裁、人工智慧及微軟研究事業部負責人沈向洋博士介紹到,在這樣的新時代,微軟有了全新的世界觀:智慧雲和智慧邊緣。

智慧雲指的是微軟 Azure ,是微軟專為人工智慧打造的雲平台。 Azure 匯聚了微軟在人工智慧領域的全部投入與技術積累,是開發、部署、運行人工智慧的雲平台,同時也是將智慧雲與智慧邊緣融會貫通的關鍵環節。

微軟一直在拓展 Azure 的功能, Azure 目前有四個方面:公有雲 Azure 、混合雲 Azure Stack 、物聯網 Azure IoT Edge 和 Azure Sphere ,以這四個方面打造出完整的計算環境,支持全新應用場景。

Azure Stack 是 Azure 公有雲在本地數據中心的擴展,可以在邊緣和離線環境運行、滿足多種監管要求。例如石油開發公司同時使用 Azure 公有雲和 Azure Stack 可以按照辦公地點靈活分配計算資源。

Azure IoT Edge 是微軟在 2017 年 Build 大會推出的針對智慧邊緣計算的產品,可以在 Linux 和 Windows 上運行,而 2018 年 Build 大會上,微軟宣布將 Azure IoT Edge 開源,允許開發者進行擴展、添加功能,並部署到任何環境中。

Azure 上的認知服務也可以擴展到 Azure IoT Edge ,目前微軟已經推出了訂製視覺服務,可以讓無人機或其它工業裝備無需連接到雲,就能做出快速的響應和處理。會上,大疆展示了與微軟的合作,利用 Azure IoT Edge 和微軟人工智慧服務,大疆開發出適用於農業、建築行業、公共安全及更多應用場景的解決方案。

Azure Sphere 主要用於保護和驅動智慧雲上的設備。 2020 年,全球智慧邊緣設備的總數將超過 200 億台,世界會成為一台超級計算機,但是我們也會擔憂安全問題。

Azure Sphere 方案將提供經過特殊設計的安全晶片、安全操作系統和能夠守護每台設備的雲端安全。

在介紹完 Azure 雲平台的四個方面後,沈向洋介紹了微軟將 Azure 與 AI 結合,打造最佳人工智慧雲平台的四個方向:認知服務、對話式人工智慧、開放平台與工具、實時人工智慧基礎設施。

Azure 認知服務

在兩年前的 Build 2016 微軟全球開發者大會上,微軟首次公佈了運行於 Azure 的認知服務,以 API 的形式為開發者提供易用的人工智慧技術能力。

目前微軟在全球推出包括語音、視覺、語言、機器翻譯等功能的 24 項服務,超過 100 萬開發者使用。

CaptionBot 能像人一樣理解和描述一張圖片,例如,你上傳一張照片, CaptionBot 能夠給出一段文字描述:比爾蓋茨正拿著一副網球拍,他看起來很高興。

此外,還介紹了微軟OCR((Optical Character Recognition光學字符識別),將為各種人工智慧應用增加圖形文字識別功能,目前支持從Office到Skype、Bing、HoloLens的微軟應用,可以識別圖像內的文字,例如識別車牌號、海報甚至是手寫的筆記。

CaptionBot和OCR都是Azure預製的人工智慧服務,微軟也針對變化的場景推出了定制視覺服務,可以讓不具備深度學習、機器視覺背景的開發者定製圖像標籤模型、物件認知模型。

微軟技術院士黃學東介紹了微軟在人工智慧語音語義方面的進展。在計算機視覺方面, 2015 年微軟亞洲研究院發布的 152 層殘差網絡(ResNet)的圖像識別準確率已經達到 96% ,勝過人類;2017 年 8 月,微軟在 Switchboard 語音識別基準測試中的錯誤率已經降低至 5.1% ,達到了媲美人類專業速記員的水平;2018 年 1 月,微軟亞洲研究院自然語言計算組率先在斯坦福大學發起的 SQuAD 文本理解挑戰賽上獲得超越人類的分數; 2018 年 3 月,微軟亞洲研究院與微軟雷德蒙研究院宣布,其研發的機器翻譯系統在通用新聞報導測試集 newstest2017 的中英測試集上,第一個達到了可以與人工翻譯媲美的水平。

5 月初,雷鋒網(公眾號:雷鋒網)曾報導, Google 在 I/O 大會上展示了Google 語音助手的 Duplex (雙工)技術,能主動給餐館、理髮店打電話,幫助用戶預約時間。由於其聲音和音調與人類幾乎沒有差別,能實現連續對話還能理解上下文快速反應,在朋友圈大火了一把。

這時,微軟坐不住了,趕緊發出了技術聲明,表明微軟小冰在兩年前就實現了 AI 與人類通電話,並且在 Google 之前就公佈了實現 AI 與人雙向交流的全雙工語音技術。

在現場,黃學東忍不住 Diss 了一下,說 Google 動不動就吹牛, 「微軟不僅有全雙工,微軟更實現了全三工、全四工、全五工……」

現場展示了一款「全多工」的產品——微軟與 Roobo 合作的 AI 會議系統。微軟特意在現場準備了四個人的現場會議演示,可以看到,這款 AI 會議系統能識別不同人的聲音,實時以文字記錄下大家的發言內容,同時識別出涉及工作安排的內容生成代辦事項。這個產品,可以說是每個團隊中會議記錄員的救星。

【原文:《一口氣看完微軟人工智慧佈局和產品落地| 微軟2018人工智慧大會》,作者:李詩,智慧機器人網編輯整理】

熱門標籤

留言

延伸閱讀