久久久综合香蕉尹人综合网,四川少妇大战4黑人,亚洲乱亚洲乱妇,无码专区永久免费av网站

首頁 公司動態(tài) NVIDIA推出新一代圖靈GPU架構(gòu):NVIDIA在光線跟蹤,GDDR6等方面實現(xiàn)雙打
NVIDIA推出新一代圖靈GPU架構(gòu):NVIDIA在光線跟蹤,GDDR6等方面實現(xiàn)雙打
2018-49-14

在NVIDIA的SIGGRAPH 2018主題演講中,公司首席執(zhí)行官Jensen Huang正式公布了該公司期待已久的圖靈GPU架構(gòu)。作為下一代NVIDIA的GPU設(shè)計,圖靈將采用一系列新功能,并將于今年推出。雖然今天宣布的重點是專業(yè)可視化(ProViz)方面的問題,在其他即將推出的NVIDIA產(chǎn)品中可能也將看到這一點。同樣地,今天的發(fā)布不應(yīng)被視為圖靈所有特征的詳盡列表。

混合渲染和神經(jīng)網(wǎng)絡(luò):RT和Tensor核心

那么圖靈帶來了什么呢?至少對于NVIDIA的專業(yè)人群而言,亮點是混合渲染,它將光線跟蹤與傳統(tǒng)光柵化相結(jié)合,以充分利用這兩種技術(shù)的優(yōu)勢。

NVIDIA將在Turing中包含更多的光線跟蹤硬件,以便提供更快,更高效的硬件光線跟蹤加速。圖靈體系結(jié)構(gòu)的新功能是NVIDIA稱之為RT核心的,其基礎(chǔ)是我們目前尚未充分了解,但作為專用光線跟蹤處理器。這些處理器塊加速了光線三角形交叉檢查和邊界體積層次(BVH)操作,后者是用于存儲光線跟蹤對象的非常流行的數(shù)據(jù)結(jié)構(gòu)。

NVIDIA表示,最快的圖靈部件每秒可以投射10億(千兆)射線,與未加速的帕斯卡相比,光線追蹤性能提高了25倍。

圖靈結(jié)構(gòu)也承載了Volta的tensor核心,甚至比Volta還要強大。tensor核心是NVIDIA計劃的重要項目之一。除了加速光線跟蹤本身之外,NVIDIA的其他工具還包括通過使用AI去噪來清理圖像來減少場景中所需的光線量,這是tensor核心所擅長的。當(dāng)然,這并不是tensor核心的唯一亮點--NVIDIA的整個AI/神經(jīng)網(wǎng)絡(luò)帝國都是基于tensor核心群, 所以雖然不是SIGGRAPH人群的主要關(guān)注點,但這也證實了NVIDIA即將到來的GPU是最強大的神經(jīng)網(wǎng)絡(luò)硬件。

新一代圖靈核心支持更廣泛的精度,可以在不需要高精度的工作負(fù)載中實現(xiàn)顯著的加速。除了Volta的FP16精密模式之外,圖靈的tensor核心還支持INT8甚至INT4精度,分別比FP16快2倍和4倍。雖然NVIDIA的PPT里沒有詳說,但是有人認(rèn)為Nvidia正在做類似于他們用于CUDA核心上的低精度操作的數(shù)據(jù)壓縮。因此,較低精度的模式雖然并不總是有用,但無疑會使一些用戶對數(shù)據(jù)吞吐量非常滿意,尤其是在推理任務(wù)中。

為了更好地利用光線追蹤和專業(yè)深度學(xué)習(xí)軟件之外的tensor核心,NVIDIA將推出一個SDK---NVIDIA NGX,將神經(jīng)網(wǎng)絡(luò)集成到圖像處理中。NVIDIA正在設(shè)想使用神經(jīng)網(wǎng)絡(luò)和tensor核心進(jìn)行額外的圖像和視頻處理,包括即將推出的深度學(xué)習(xí)抗鋸齒(DLAA)等方式。

圖靈SM:可變速率著色,專用INT核心等

除了專用的RT和tensor核心,圖靈架構(gòu)流式多處理器(SM)本身也在學(xué)習(xí)一些新的技術(shù)。特別是在這里,它繼承了Volta的一個更新穎的變化,它將整數(shù)核心分離成自己的塊,而不是浮點CUDA核心的一個部分,加速了地址生成和融合乘法加法(FMA)性能。

說到ALU,NVIDIA已經(jīng)確認(rèn)圖靈支持“可變速率著色”,這是用于著色器性能隨數(shù)據(jù)類型大小縮放的術(shù)語。在Volta中,這表現(xiàn)為FP16操作速度是FP32速率的2倍,INT8操作速度是INT32速率的4倍??勺兯俾手⒖焖俅虬鼣?shù)據(jù)包以及將多個較小的操作打包到一個較大的操作中的相關(guān)操作,都是在摩爾定律減速時提高GPU性能的關(guān)鍵組成部分。通過判斷需要使用精確的數(shù)據(jù)類型,可以將它們打包在一起以在相同的時間段內(nèi)完成更多的工作,反過來對于神經(jīng)網(wǎng)絡(luò)推理和其他類似的動作尤其重要,因為到目前為止,大多數(shù)神經(jīng)網(wǎng)絡(luò)模型顯示它們不需要提供與FP32/INT32相近的精度。

Turing SM還包括NVIDIA稱之為“統(tǒng)一緩存架構(gòu)”的內(nèi)容。NVIDIA表示它提供的帶寬是“上一代”的兩倍,目前還不清楚NVIDIA是指Pascal還是Volta,Pascal可能性更大。

下面是第一代GDDR6顯存規(guī)格:

image.png

相對于GDDR5X而言,GDDR6的提升并不像過去的幾代產(chǎn)品那么大,因為GDDR6的許多創(chuàng)新已經(jīng)融入到GDDR5X中,GDDR6有望成為除了HBM2這種高端產(chǎn)品外的GPU行業(yè)標(biāo)準(zhǔn)顯存。GDDR6工作電壓更低,僅1.35v,內(nèi)部存儲器現(xiàn)在被分成每個芯片兩個存儲器通道。 對于標(biāo)準(zhǔn)的32位寬芯片,這意味著一對16位存儲器通道,256位卡上總共16個這樣的通道。 GPU可以很好利用這些通道,畢竟顯卡是一種大規(guī)模并行設(shè)備。

NVIDIA已經(jīng)證實,第一款Turing Quadro顯卡將以14Gbps的速度運行GDDR6,這恰好是所有Big 3成員提供的最快速度等級。 也就是說,NVIDIA也證實了使用三星的顆粒,特別是先進(jìn)的16Gb容量模塊。 對于典型的256位GPU來說,NVIDIA可以使用標(biāo)準(zhǔn)的8個模塊裝配卡,并獲得16GB的總?cè)萘?,甚至可以達(dá)到32GB。

image.png

與此同時,游戲玩家和專業(yè)用戶對VR的期待變?yōu)楝F(xiàn)實,新一代顯卡增加了VirtualLink支持。而USB Type-C備用模式于上個月發(fā)布,通過一根電纜支持15W +電源,可傳輸10Gbps USB 3.1 Gen 2數(shù)據(jù)和4通道DisplayPort HBR3視頻。這可以被視為有額外數(shù)據(jù)和電源的DisplayPort 1.4,允許視頻卡直接驅(qū)動VR設(shè)備。該標(biāo)準(zhǔn)得到了NVIDIA,AMD,Oculus,Valve和微軟的支持,因此圖靈產(chǎn)品將成為支持該標(biāo)準(zhǔn)的眾多產(chǎn)品中的第一款。

核心數(shù)字:

image.png


即將到來的2018年第四季度

除了圖靈架構(gòu),NVIDIA還宣布推出基于圖靈GPU的前3款Quadro顯卡 - Quadro RTX 8000,RTX 6000和RTX 5000 - 將于今年第四季度上市。對于NVIDIA的特斯拉客戶來說,圖靈的發(fā)布讓Volta處于不穩(wěn)定的狀態(tài)。 NVIDIA沒有告訴我們圖靈是否最終會擴展到高端的特斯拉空間 - 取代GV100 - 或者說明Volta是否仍將成為所在領(lǐng)域的頂梁柱。

定制專屬于我的服務(wù)器
可選購標(biāo)準(zhǔn)配置的服務(wù)器產(chǎn)品,也可以根據(jù)自己需求定制專屬服務(wù)器
開始定制
服務(wù)熱線:400-028-1968 028-85099673 13881950196
工作時間:周一至周六 09:00-18:00(北京時間)
Copyright ? 2025 成都網(wǎng)爍信息科技有限公司 版權(quán)所有
本網(wǎng)站直接或間接向消費者推銷商品或者服務(wù)的商業(yè)宣傳均屬于“廣告”(包裝及參數(shù)、售后保障等商品信息除外)