深度學習是目前科技型企業(yè)甚至不少傳統(tǒng)企業(yè)轉型的“方舟”,今天以一位網爍的服務器客戶為例,為大家分享一臺深度學習服務器的搭建思路。這位客戶是從事新材料行業(yè),打算購入一臺GPU服務器進行深度學習訓練代替人工,讓AI來檢驗材料表面,提高檢測效率。
首先我們來看一看這臺服務器的基礎配置:
服務器是以Supermicr 7048GR-TR平臺為核心,平臺支持Intel?Xeon E5-2600V3/V4系列,QPI高達9.6GT/S,支持4通道內存;
內存方面,平臺支持最高2TB 2400MHz的DDR4 ECC 3DS LRDIMM內存,主板上內存插槽共計16根;
擴展方面,4條PCI-E 3.0 x16、2條PCI-E 3.0 x8和1條1個PCI-E 2.0 x4插槽,支持最高4張NVIDIA GPU卡;
板載ASPEED AST2400 BMC芯片提供視頻輸出,2個RJ45 2GbE網口和1個IPMI遠程管理端口為這臺服務器提供了遠程監(jiān)控能力;
平臺的存儲能力也相當可觀,共有8個3.5英寸標準熱插播托盤和3個5.25的標準光驅位;
電源采用具有PMBus 協議的2000W冗余電源;
散熱方面,中部風墻采用4個92x38mm 4pin可調速散熱風扇,后部風扇數為4,其中2個為可選。
網爍根據該客戶的實際需求,為客戶定制了以下方案:
GPU卡:客戶的服務器采用了四張Nvidia GTX TITAN Xp作為GPU卡配置,為什么要采用TITAN XP作為深度計算的GPU卡,而不是最新的TITAN V呢?我們看數據說話:
GPU卡對深度學習影響最大的三個參數分別是單精度浮點運算(越高越好)、顯存帶寬(越高越好)和顯存容量(越多越好)。與TITAN XP相比,TITAN V價格高出2.49倍,然而在單精度浮點運算能力、顯存帶寬上的優(yōu)勢僅僅為1.23倍和1.19倍,TITAN XP與TITAN V的顯存容量也相同,二者相比自然選擇性價比更優(yōu)的TITAN XP。況且,購買4張TITAN XP的價格只能購入1.6張TITAN V,而四張TITAN XP后四倍數值的提升(根據運行環(huán)境不同,實際數據可能會有略微出入)對TITAN V的優(yōu)勢無疑是很明顯的。
散熱:根據我們的經驗,在多GPU卡時應該采用最大風扇數配置才能達到良好的散熱效果,所以我們在備選散熱風扇位置安裝了2枚球形風扇,以保證GPU卡散熱良好。
CPU:CPU采用了兩顆E5-2678V3 2.5G 十二核處理器。這顆CPU架構為Haswell,適用于Socket 2011-3插槽,擁有2.5GHz主頻和2.9GHz睿頻,L3為30MB,TDP為120W,總線速度為5GT/s,支持雙通道DDR4類型內存。本地存儲、內存和顯存之間數據交換需要消耗大量CPU資源,而兩顆十二核心處理器為深度學習服務器提供了良好的支持。
內存:根據經驗,內存的容量通常至少為GPU卡顯存容量的2倍才足以應對內存與顯存之間巨大的數據交換。深度學習對內存的消耗主要分為輸入的圖像數據、模型復雜程度、各層響應。其中學習資料占用很小,一張256X256的彩色學習圖片大小以192KB來計算,即使加載1萬張學習庫也僅僅占用不到2GB內存;而神經網絡識別模型和各層的響應則是內存占用大戶,結構越復雜,運算時占用的內存就越多。所以我們?yōu)橛脩粼谄脚_上搭載了4跟金士頓 32G RECC DDR4 2400MHz內存,保證雙通道發(fā)揮出內存讀寫最大性能的同時,128G內存又滿足了內存兩倍于顯存(48G)的容量要求。
Intel SSD S4500 480G,采用企業(yè)級SSD一方面為了保證數據吞吐時不會造成性能瓶頸,另一方面企業(yè)級SSD的平均無故障時間和完善的質保體系遠超消費級SSD。
以上就是該服務器的配置情況,如果你對深度學習、人工智能服務器有需求,歡迎聯系網爍的客服電話400-028-1968,我們將及時為你跟進,為你搭建適用、好用的專業(yè)計算機。