久久久综合香蕉尹人综合网,四川少妇大战4黑人,亚洲乱亚洲乱妇,无码专区永久免费av网站

首頁 行業(yè)動態(tài) 實不相瞞,深度學習計算還是得看英偉達
實不相瞞,深度學習計算還是得看英偉達
2018-06-29

北京時間3月28日,英偉達(NVIDIA)在美國加州圣何塞召開GPU技術(shù)大會(GTC)。本屆大會上,深度學習又一次不出意外地成為“主角”,圍繞這一領(lǐng)域,掌門人黃仁勛先生介紹了一系列重要產(chǎn)品及更新的發(fā)布。此外,在計算機圖形、專業(yè)可視化、自動駕駛、物聯(lián)網(wǎng)、GPU云等方面,英偉達也有各項發(fā)布。本文中,我們主要關(guān)注深度學習:

3a3ef0b856de4806.jpg


世界最大GPU:DGX-2在手“虐神仙”

  “先有仁勛后有天,顯卡在手虐神仙?!边@是網(wǎng)友對英偉達CEO黃仁勛的一句調(diào)侃,恰到好處地反映了他的行事風格。這樣一個“狂人”,常常能給我們帶來巨大的沖擊。今天發(fā)布的NVIDIA DGX-2就是其中之一。

  NVIDIA DGX-2 是英偉達的第二代 DGX,黃仁勛表示:“這是全球最大的GPU?!?嚴格來說它是一個計算系統(tǒng)。)重量超300斤,有汽車后備箱那么大,“沒有人能把它舉起來”。DGX-2問世,黃教主向稱霸武林的目標又近了一步。

  顯然,這款產(chǎn)品的特色并不止于“大”。它是英偉達在深度學習計算領(lǐng)域取得的重大突破,是首款能夠提供每秒2千萬億次浮點運算能力的單點服務(wù)器,也是首款采用 NVSwitch(本次大會另一項重要發(fā)布,稍后我們會介紹)的系統(tǒng),其中采用的 16 個 GPU 均共享統(tǒng)一的內(nèi)存空間。DGX-2 具有 300 臺服務(wù)器的深度學習處理能力,占用15個數(shù)據(jù)中心機架空間,而體積則縮小60倍,能效提升18倍。

856f13b698cbad7d.jpeg

據(jù)悉,DGX-2可提供的深度學習性能為上代DGX-1(去年9月發(fā)布)的約10倍。僅僅半年左右的時間,這一提升實在令人驚嘆。“狂人”黃仁勛,狂得有理。

  NVIDIA DGX-2售價為 39.9 萬美元(約250萬人民幣),將于今年第三季度正式開放購買。

  新一代革命性高速互聯(lián)技術(shù)發(fā)布,NVLink說再見?

  談到CPU-GPU、GPU-GPU之間的高速互聯(lián),大家首要提的就是NVLink,不過這種現(xiàn)狀可能將要發(fā)生改變了。此次大會上,NVIDIA NVSwitch作為一個革命性的全新 GPU 互聯(lián)結(jié)構(gòu),與大家見面。

e84eac52219d0f6d.png


NVSwitch在NVLink的基礎(chǔ)上進一步進行了擴展創(chuàng)新,它的帶寬比最好的 PCIe 交換機高出 5 倍,它可使多達 16 個 Tesla V100 GPU 同時以 2.4 TB /秒的速度進行通信,這一速度創(chuàng)下歷史新高,也讓開發(fā)者能夠采用更多的超級互聯(lián)GPU來構(gòu)建更高級的系統(tǒng),進而靈活地連接任何基于NVLink的GPU的拓撲結(jié)構(gòu)。我們上面所說的DGX-2,就得益于NVSwitch的超級互聯(lián)特性。

  NVSwitch的優(yōu)勢是顯而易見的,其成熟程度我們尚未可知。不過,相信很多朋友看到它的第一反應(yīng)就是將取代NVLink。難道我們這么快就要對NVLink說再見了嗎?

  Tesla V100內(nèi)存翻倍,掀起新一輪小規(guī)模計算迭代

  英偉達平臺在各大云服務(wù)提供商和服務(wù)器制造商中已得到廣泛應(yīng)用,最強大的數(shù)據(jù)中心GPU——NVIDIA Tesla V100,也得到了重大提升:2倍內(nèi)存。如今Tesla V100 GPU配備了32GB內(nèi)存,將助力數(shù)據(jù)科學家對更深度、更大規(guī)模的深度學習模型進行訓練,且比以往都更加精確。與之前的16GB版本相比,它還能將內(nèi)存受限的HPC應(yīng)用性能提升高達50%。

8701dd10d10df895.jpg

Tesla V100 32GB GPU目前可用于所有 NVIDIA DGX 系統(tǒng)。此外,各大計算系統(tǒng)制造商Cray、HPE、IBM、聯(lián)想、Supermicro和Tyan也宣布將于第二季度內(nèi)推出各自全新的Tesla V100 32GB系統(tǒng)。Oracle云也宣布計劃將于今年下半年在云端提供Tesla V100 32GB。

  種種跡象表明,Tesla V100的提升,可能將掀起新一輪數(shù)據(jù)中心GPU計算平臺迭代。當然,客觀來講其規(guī)模可能不會太大,這要看企業(yè)和組織的實際需求。

  軟件堆棧更新,推動計算性能提升

  英偉達深度學習和 HPC 軟件堆棧的更新面向開發(fā)者社群免費提供。據(jù)了解,當前開發(fā)者社群共有超過 82 萬名注冊用戶。此次更新包括新版本的 NVIDIA CUDA、TensorRT、NCCL和cuDNN,以及面向機器人的全新 Isaac軟件開發(fā)套件。此外,通過與領(lǐng)先云服務(wù)提供商的密切合作,各大主流深度學習框架都在持續(xù)優(yōu)化,以充分利用英偉達的GPU計算平臺。

  今天發(fā)布的TensorRT 4推理軟件,與谷歌的TensorFlow框架深度融合。據(jù)了解,針對計算機視覺、神經(jīng)網(wǎng)絡(luò)機器翻譯、自動語音識別、語音合成與推薦系統(tǒng)等常見應(yīng)用,相比CPU,該軟件最高可將深度學習推理的速度加快190倍。

  另外,最受歡迎的語音識別框架Kaldi現(xiàn)也已針對GPU進行了優(yōu)化。

620ecfd3d588f623.jpeg

深度學習計算≈英偉達

  黃教主雷厲風行的個性顯然對英偉達也產(chǎn)生了不小的影響,從最初發(fā)現(xiàn)GPU在深度學習計算方面的潛力,到如今幾乎“無GPU不深度學習”的行業(yè)現(xiàn)狀,英偉達毅然向人工智能轉(zhuǎn)型,投入大量資源用以研發(fā),不斷推陳出新,極大地推動了GPU在人工智能計算的應(yīng)用,同時更推動了人工智能行業(yè)的發(fā)展。

  本屆GTC上關(guān)于深度學習的各項重要發(fā)布,也再次向我們證明了這一點?;诖耍f一句“深度學習計算≈英偉達”不算過分吧。




 it168網(wǎng)站原創(chuàng)  作者: 謝濤

定制專屬于我的服務(wù)器
可選購標準配置的服務(wù)器產(chǎn)品,也可以根據(jù)自己需求定制專屬服務(wù)器
開始定制
服務(wù)熱線:400-028-1968 028-85099673 13881950196
工作時間:周一至周六 09:00-18:00(北京時間)
Copyright ? 2025 成都網(wǎng)爍信息科技有限公司 版權(quán)所有
本網(wǎng)站直接或間接向消費者推銷商品或者服務(wù)的商業(yè)宣傳均屬于“廣告”(包裝及參數(shù)、售后保障等商品信息除外)