在日本的GPU技術(shù)大會(GTC)上,Nvidia推出了一款用于推理工作負(fù)載的新計(jì)算卡--Tesla T4。
該卡擁有320個Tensor核心和2560各CUDA核心,功耗低至75W,而FP16半精度峰值性能為65 TFLOPS,INT8為130 TFLOPS,INT4為260 TFLOPS。除了該Tesla計(jì)算卡外,英偉達(dá)還宣布推出面向數(shù)據(jù)中心的Nvidia TensorRT超大規(guī)模推理計(jì)算平臺,該平臺使用T4 GPU進(jìn)行實(shí)時推理。
英偉達(dá)加速業(yè)務(wù)副總裁兼通用汽車(GM)伊恩?巴克(Ian Buck)表示:“我們的客戶正朝著人工智能能夠觸及和改善每一種產(chǎn)品和服務(wù)的未來飛奔?!庇ミ_(dá)TensorRT Hyperscale平臺的建立是為了實(shí)現(xiàn)這一目標(biāo),比以前的產(chǎn)品更快速、更高效。
微軟Bing和AI產(chǎn)品副總裁Jordi Ribas補(bǔ)充道:“在實(shí)時推理工作負(fù)載中使用Nvidia gpu改進(jìn)了Bing的高級搜索功能,使我們能夠減少圖像的對象檢測延遲。我們期待與英偉達(dá)的下一代推理硬件和軟件合作,擴(kuò)大人們從人工智能產(chǎn)品和服務(wù)中獲益的方式。
谷歌云的產(chǎn)品經(jīng)理Chris Kleban也表示,公司“很高興能很快在谷歌云平臺上支持英偉達(dá)的Turing Tesla T4計(jì)算卡”。服務(wù)器制造商包括思科,戴爾EMC,富士通,HPE,IBM,甲骨文和Supermicro也計(jì)劃發(fā)布帶有T4的GPU服務(wù)器。
關(guān)于GTC的其他消息
本次東京GTC,Nvidia也參與了一些與自動駕駛汽車相關(guān)的計(jì)劃。有消息稱,日本電報電話集團(tuán)計(jì)劃將基于Tensor Core GPU的Nvidia AI平臺作為其全公司“corevo”AI計(jì)劃的通用平臺,F(xiàn)ujifilm將使用DGX-2系統(tǒng)進(jìn)行AI研究。