昨天的NVIDIA(英偉達(dá))GTC(中國(guó)臺(tái)北)2018大會(huì)上,CEO黃仁勛正式發(fā)布了首款同時(shí)適用于人工智能與高性能計(jì)算的統(tǒng)一計(jì)算平臺(tái)——NVIDIA HGX-2。
說(shuō)起來(lái),大家應(yīng)該對(duì)NVIDIA在GTC 2018(美國(guó)圣何塞)大會(huì)上發(fā)布的“全球最大GPU”DGX-2多少還有些印象,據(jù)稱(chēng),這個(gè)系統(tǒng)就是采用HGX-2構(gòu)建的。而在昨天的大會(huì)上,NVIDIA方面也表示,DGX-2系統(tǒng)將在第三季度銷(xiāo)售,售價(jià)約為399000美元。
黃仁勛在大會(huì)上表示:“計(jì)算領(lǐng)域已不同從前。計(jì)算需求猛增,而 CPU 擴(kuò)展的速度卻呈放緩之勢(shì)。配備Tensor Core GPU的NVIDIA HGX-2為業(yè)界提供了融合HPC和AI的多功能計(jì)算平臺(tái),這一強(qiáng)大的計(jì)算平臺(tái)將助力解決全球面臨的重大挑戰(zhàn)?!?/span>
HGX-2采用了最新的NVSwitch互聯(lián)技術(shù),將16個(gè)Tesla V100 Tensor Core GPU連接為單一巨型GPU,據(jù)介紹,它可提供每秒2千萬(wàn)億次浮點(diǎn)計(jì)算的AI性能。作為參考,它的上代產(chǎn)品——去年于Computex 2017上發(fā)布的HGX-1,只裝載了8個(gè)GPU。NVSwitch是NVIDIA在圣何塞GTC 2018大會(huì)上發(fā)布的最新GPU互聯(lián)結(jié)構(gòu),在NVLink的基礎(chǔ)上進(jìn)一步進(jìn)行了擴(kuò)展創(chuàng)新,它的帶寬比最好的 PCIe 交換機(jī)高出5倍,它可使多達(dá)16個(gè)Tesla V100 GPU同時(shí)以2.4 TB /秒的速度進(jìn)行通信。
接力登場(chǎng)的HGX-2平臺(tái)具備多精度計(jì)算能力,可提供獨(dú)特的靈活性。該平臺(tái)能夠針對(duì)科學(xué)計(jì)算和模擬進(jìn)行高精度的FP64和FP32運(yùn)算,并針對(duì) AI訓(xùn)練和推理進(jìn)行 FP16 和 Int8 運(yùn)算,以“多功能性”滿(mǎn)足先進(jìn)越來(lái)越多融合HPC和AI的應(yīng)用對(duì)計(jì)算的需求。
NVIDIA稱(chēng),HGX-2在ResNet-50訓(xùn)練基準(zhǔn)下,創(chuàng)下了每秒15500幅圖像的AI訓(xùn)練速度記錄,可取代高達(dá)300臺(tái)僅配備CPU的服務(wù)器。從這個(gè)角度來(lái)看,該產(chǎn)品可以說(shuō)確實(shí)貫徹了黃仁勛始終堅(jiān)持的“省錢(qián)”理念。在大會(huì)上,黃仁勛也笑稱(chēng):“買(mǎi)得越多,省得越多。”
HGX-2的賣(mài)點(diǎn)在于,它既可以用于AI訓(xùn)練,也可以用于推理,同時(shí)還能夠?yàn)镠PC應(yīng)用提供計(jì)算支持。在NVIDIA的命名體系中,HGX-T用于AI訓(xùn)練,HGX-I用于推理,而SCX系統(tǒng)則用于HPC。
NVIDIA將HGX-2描述為“構(gòu)建模塊”,制造商可使用它來(lái)構(gòu)建適用于AI和HPC的系統(tǒng)。事實(shí)上,現(xiàn)在已經(jīng)有多家計(jì)算系統(tǒng)制造商宣布計(jì)算推出基于HGX-2計(jì)算平臺(tái)的系統(tǒng)。包括聯(lián)想、云達(dá)科技、超微和緯穎科技四家服務(wù)器制造商,他們宣布計(jì)劃于今年下半年將各自的基于HGX-2系統(tǒng)推向市場(chǎng)。此外,全球四大原始設(shè)備制造商(ODM)富士康、英業(yè)達(dá)、廣達(dá)和緯創(chuàng)也正在設(shè)計(jì)基于 HGX-2 的系統(tǒng),有望于下半年在全球幾家最大型的云數(shù)據(jù)中心投入使用。
NVIDIA在面向人工智能工作負(fù)載的GPU市場(chǎng)上是毫無(wú)爭(zhēng)議的領(lǐng)導(dǎo)者,但仍不可避免地要面臨日益激烈的競(jìng)爭(zhēng)。2016年英特爾收購(gòu)了Nervana 公司,目前在英特爾Nervana 神經(jīng)網(wǎng)絡(luò)處理器(NPU)方面也一直在進(jìn)行大量投入與研發(fā),在人工智能領(lǐng)域,它將是NVIDIA GPU的一個(gè)有力競(jìng)爭(zhēng)對(duì)手。
與此同時(shí),市場(chǎng)上可提供的FPGA(現(xiàn)場(chǎng)可編程門(mén)陣列)也越來(lái)越強(qiáng)大,這些FPGA可用于AI推理。雖然FPGA在AI訓(xùn)練方面缺乏與GPU對(duì)抗的性能,但它可以被編程來(lái)處理一個(gè)神經(jīng)網(wǎng)絡(luò)的每一個(gè)層次,在推理方面擁有理想的靈活性。
it168網(wǎng)站原創(chuàng) 作者: 謝濤