英偉達於 GTC 上展示技術 全球最大 CPU、全 VR 自動駕駛路側!英偉達CEO:「Buy more GPU,save more money」

英偉達於 GTC 上展示技術 全球最大 CPU、全 VR 自動駕駛路側!英偉達CEO:「Buy more GPU,save more money」

▲英偉達於 GTC 上展示技術。(圖/翻攝自雷鋒網,下同)

【原文:《“全球最大GPU”、全VR自動駕駛路測,快來看“推銷狂人”黃仁勳發了啥》,作者:李賡,智慧機器人網編輯整理】

文、圖/雷鋒網

雷鋒網按:Buy more GPU,save more money!(買越多GPU,省越多錢!)上面這句話,英偉達 CEO 黃仁勳在整場 GTC 中足足重複了 9 次(可能還有數漏的)。

作為英偉達每年最重要的大會,一年一度在美國舊金山舉辦的 GTC 一直都是英偉達技術實力最集中的展示。這些技術實力往往覆蓋多個方向,大家關注最多的無疑是“新核彈”,更通俗的說—— 全新的GPU架構、更強大的GPU等等。

事實上,他們都“缺席”了本次 GTC 2018 。或許是受此影響,再加上美股大盤整體下挫,英偉達股價在整場 GTC 進行期間不斷下滑,截止發稿整體跌幅已經超過 7% 。

這樣的股價表現,不由得讓人們心中浮現一個問題—— 這次 GTC 真的有那麼糟麼?(事實上,有部分友媒已經開始發文看衰英偉達了,但這樣的判斷真的是對的麼?)為了解答這個問題,我們首先有必要先重新一下黃仁勳在本次GTC Keynote中提及的各種內容。

看似槽點、其實亮點:「世界最大的GPU」

正如上文所提到的,本次 GTC 之上沒有像之前大家預期的那樣,發布全新的 GPU 架構,以及傳統定義上的“核彈”(單顆 GPU 、或者單顯卡封裝的產品)。

但英偉達實際上拿出了一款被黃仁勳自己稱為“全球最大的 GPU ”的新產品—DGX – 2。

去年發布 Volta 架構之時,英偉達實際上已經將 DGX – 1 中原有的 P100 GPU 換成了 V100 GPU 。原有的 V100 GPU 已經很強大了,那麼想要更強大就只剩一種“簡單而又粗暴”的方法了:再加幾顆 V100 GPU ,這也是為啥在 DGX – 2 服務器加速器中你會看到有 16 顆 V100 GPU 。

GPU數量是翻倍了,但要想將他們發揮出真正的威力,英偉達還祭出了一項升級版的技術NVLink Switch(簡稱NV Switch)。這項技術的目標只有一個:讓DGX-2中的16顆V100 GPU能夠化身為一顆巨大的“GPU”運作。

根據英偉達副總裁和DGX系統產品經理Jim McHugh介紹,因為NVswitch技術, DGX – 2 中的 16 顆 GPU 之間都能夠直接 1 對 1 連接傳輸,每顆 GPU 擁有高達 50Gb/s 的帶寬,同時最多支持 18 顆 GPU 相互連接,讓整個系統的吞吐性能達到驚人的 900Gb/s 。

最後是整個系統的售價,黃仁勳現場表示展示用的這套實驗產品實際上價值 250 萬美元,然後先放出了一個 150 萬美元的售價,在最後一秒直接自己“砍到”了 39.99 萬美元。

值得一提的是, DGX – 2 中使用的雖然還是 V100 GPU ,但它發生了一點小變化——原有的 4 顆 4GB HBM2 顯存,升級為 4 顆 8GB HBM2 顯存,也讓 V100 GPU 的整體顯存大小升級為 32GB 。(GPU其他參數,包括顯存位寬、帶寬均沒有改變。)而在 DGX – 2 中, 16 個 V100 GPU 中各自擁有的 32GB 顯存都將連接到一起,你甚至可以將它看成一整個 512GB 的顯存空間。

那麼究竟這對於用戶來說有多大的影響呢?英偉達官方的原話是:「顯存容量增加,讓運行更深、更大的深度學習模型成為可能,同時也會提升深度學習的表現。對於內存大小比較敏感的應用,最多能夠提升 50% 的實際表現。」

拋開 DGX – 2 的性能本身、拋開 DGX – 2 在各種深度學習解決方案的性價比等等,英偉達在 DGX – 2 上所採取的新策略或許更值得思考:並行架構先天擁有優秀的擴展性,英偉達似乎在傳統的 GPU 架構、晶片製程之外找到了一個延續性更強的性能增長路線。

當然從另外一個方面來講,通過數量的疊加,設備的性能的確可以快速增長,但如何實現數塊 GPU 之間的大量數據吞吐、同時保證這些新添加的數據傳輸能力不會造成太高的成本、以及更多的功耗,將會是這一種路線的挑戰。

高速、高效,讓自動駕駛路測走向 VR 時代

在眾多的人工智慧應用當中,自動駕駛絕對是英偉達最堅定的一個方向。在今年 GTC 大會的演講上,英偉達創始人兼 CEO 黃仁勳又為自動駕駛行業帶來了一個全新的解決方案——  Drive Constellation 。

Drive Constellation 是一種使用虛擬現實(VR)技術的自動駕駛的模擬器,它讓自動駕駛的開發者們在數據中心打造一個虛擬世界,並對自動駕駛車輛的算法進行數十億英里的測試。英偉達方面希望,通過自身強大的圖像渲染和虛擬現實技術,讓算法在虛擬環境中的測試無限接近於真實場景。

它的組成結構也非常簡單,外觀看上去就是兩台 DGX – 1 服務器。不過兩台服務器中的內容不太一樣:一台配置了數張英偉達的專業顯卡,另外一台則裝著和自動駕駛車輛相同的英偉達 DRIVE PX 平台。

整個系統的工作方式也非常簡單,配置了專業顯卡的服務器結合高清地圖、車輛行駛模擬算法、以及天氣、光照等一系列條件,經由專業渲染形成虛擬的駕駛環境。然後這些數據以類似於真實傳感器的格式被直接發送到裝載著 Drive PX 平台的服務器中, Drive PX 平台根據這些數據,執行相應的自動駕駛算法,並且最終將車輛的操縱輸出返回到虛擬化的服務器中,形成循環。

根據英偉達官方的說明,兩台服務器在 1 秒的時間內可以進行 30 次這樣的循環。英偉達還表示,這套系統能夠模擬不同的天氣,如暴風雨雪天氣、一天中不同時刻致盲的炫光、夜晚有限的視野以及不同類型的路況和地形。同時,它也可以模擬危險的路況以測試自動駕駛汽車的反應能力。然後開發者可以對自動駕駛的算法進行改進和完善。

英偉達汽車部門高級主管 Danny Shapiro 對此表示:「這對於行業來說是一個非常有價值的工具,它能夠加速自動駕駛的研發進程。 」黃仁勳在演講中也說了一個數字: 10000 套 Drive Constellation 系統,一年就能夠路測 30 億英里。

據雷鋒網了解, Drive Constellation 將在今年第三季度推向市場,並為英偉達的早期客戶提供服務。

在英偉達的生態系統中,目前已經匯集了超過 370 個不同的公司。大家將合力開發自動駕駛技術。雖然這個數字反映了英偉達陣營的龐大,但這個生態中的 370 個合作夥伴並不都是汽車廠商。具體來說,這些合作夥伴包括乘用車,卡車、物流車和自動駕駛出租車等,一級供應商,自動駕駛初創公司、激光雷達公司、地圖公司等等。

通過這套虛擬現實的駕駛模擬器,英偉達完全可以將數量眾多的合作夥伴放到一個平台當中,加速自動駕駛技術研發、落地的進程,反過來鞏固英偉達自身硬體在自動駕駛領域的不可替代性。

持續滲透的 TensorRT ,不斷加速的 AI 版圖

TensorRT 也是一項英偉達去年發布的新技術,它的目標是將各種人工智慧架構的算法,與英偉達各種架構的 GPU 相適配,通過二次優化算法提升整體算法在英偉達 GPU上面運行的效率。

而在本次 GTC 之上,英偉達也拿出了最新版本的 TensorRT 4 ,它最重要的特點就是更高的效率,根據英偉達官方的測試在多種人工智慧算法在同一個服務器上運行的時候, TensorRT 4 能夠減少 70% 的硬體需求,同時還能在延遲方面提升 190 倍。

相比性能方面的提升,此次 TensorRT 在業界支持方面的新進展其實更加值得關注。因為在去年 TensorRT 某種程度上已經是一個英偉達自己的人工智慧架構,而且是凌駕於幾乎所有人工智慧架構的終極架構。這對於之前希望通過培育人工架構、打造自由人工智慧生態的公司來說並不是好事。

令人驚喜的是,英偉達官方表示已經和 Google 達成合作,將在最新的 TensorFlow 1.7 版本中直接內嵌 TensorRT ,進而進一步加強 TensorFlow 架構在 GPU 中的表現。 Goolge 的工程總監 Rajat Monga還 特別表示, Google 的 TensorFlow 團隊一直和英偉達保持著緊密的合作關係。

其他“一部分”重點內容:光線追踪、醫療平台、自家GPU雲技術、自動駕駛路線圖、遠程VR駕駛

  • 英偉達RTX技術

RTX技術是目前市面上最強大的光線追踪技術,可以對多種材質進行最接近真實的實時渲染,現場演示中還包括了比較複雜的動態場景。

  • 醫療平台Clara

由人工智慧驅動的醫療平台Clara是英偉達的一次全新嘗試,現場的展示中,英偉達通過對一個二維的超聲波探測實時結果進行處理,直接精準還原患者體內臟器的活動,甚至可以直接算出心臟的容積、以及每次跳動的體積差異。

  • 未來自動駕駛平台路線圖

Roadmap是半導體廠商常見的一種產品規劃手段,最出名的要數Intel已經失效的“Tick-Tock”。在本次 GTC 上,黃仁勳也分享了英偉達DRIVE系列產品的RoadMap策略——小尺寸的單晶片平台,然後通過晶片數量和GPU的添加獲得更強的性能,然後利用技術將更強的性能再次壓縮為小尺寸的單晶片平台,一次類推。

現場透露下一代單晶片平台代號為Orin。

  • 基於Holodeck的遠程虛擬駕駛系統

打算用VR來做遠程駕駛的初創公司可能很崩潰。

雷鋒網總結:GPU的動力依舊強勁,英偉達不只是一家“性能驅動公司”

回顧完現場的主要內容,自然也是時候再反過頭來看上文開篇的問題了。首先不得不提的就是人們對於GPU的期待,雖然在前幾年的歷程中,英偉達幾乎源源不斷地拿出更新、更強大的GPU晶片。但它終究也是半導體的晶片,同樣會受到製程的物理限制,單顆晶片的提升難度還將不斷提升。

但因為並行運算的原因,GPU實際上很容易進行橫向的拓展,此次GTC上發布的全新16顆V100 GPU的DGX-2加速器就是最好的證明。在利用合適的數據傳輸技術的前提下,GPU未來的動力增長依舊會“很強勁”。

另外一個要點實際上是英偉達在硬體之外所做的諸多工作,從針對各種人工智慧架構、算法的持續優化,到完全VR化的自動駕駛路測,英偉達實際上在不斷為整個生態賦能,掃除一些關鍵性的障礙。這種能力,放眼人工智慧、自動駕駛這樣的領域,都是無人能及的。

毫無疑問,在 2018 接下來的日子裡,教主和他的英偉達,還將給我們帶來更多驚喜。

【原文:《“全球最大GPU”、全VR自動駕駛路測,快來看“推銷狂人”黃仁勳發了啥》,作者:李賡,智慧機器人網編輯整理】

熱門標籤

留言

延伸閱讀