在幾周前,美國(guó)能源部正式公布了其新一代超級(jí)計(jì)算機(jī)——“Summit”,這個(gè)消息想必大家都已有所耳聞。據(jù)稱,其運(yùn)算性能可達(dá)到200PFlops,合作伙伴是IBM和英偉達(dá)。
美國(guó)今年在超級(jí)計(jì)算機(jī)方面的動(dòng)作不止一個(gè)Summit。據(jù)外媒報(bào)道,本周早些時(shí)候,HPE和美國(guó)能源部宣布將安裝一臺(tái)名為Astra的超級(jí)計(jì)算機(jī),可能最早會(huì)在今年夏天結(jié)束時(shí)完成,雖然無(wú)法確定具體時(shí)間,但可以肯定的是在今年年底之前。
該系統(tǒng)將被美國(guó)國(guó)家核安全管理局用于運(yùn)行建模和模擬工作負(fù)載,以解決國(guó)家安全、能源和科學(xué)等問(wèn)題。
Astra將成為目前世界上最強(qiáng)大的基于ARM的超級(jí)計(jì)算機(jī)
Astra的理論運(yùn)算性能峰值可達(dá)到2.3PFlops,跟Summit與我國(guó)的神威·太湖之光(93.9PFlops)比起來(lái),前者的性能確實(shí)有點(diǎn)不夠看,但它也有自己的獨(dú)到之處。
“它不是世界上最強(qiáng)大的超級(jí)計(jì)算機(jī),但它是迄今為止最大的基于ARM的計(jì)算機(jī)?!盚PE高級(jí)技術(shù)集團(tuán)的副總裁Mike Vildibill在一次采訪中表示,“(在全球超級(jí)計(jì)算機(jī)排行中)它仍然在前100名,這是一個(gè)非凡的里程碑。據(jù)我所知,目前全球超算TOP500中還沒(méi)有基于ARM的系統(tǒng),從這我們也能看出美國(guó)能源部在將這種新架構(gòu)帶進(jìn)他們的生產(chǎn)環(huán)境方面有多么積極?!?/p>
該系統(tǒng)基于HPE的Apollo 70系統(tǒng),2U空間,每個(gè)包含四臺(tái)服務(wù)器,每臺(tái)服務(wù)器分別使用兩個(gè)Cavium ThunderX2片上系統(tǒng)??偠灾?,該系統(tǒng)將使用5184個(gè)CPU來(lái)部署2592個(gè)服務(wù)器,所有這些服務(wù)器都使用InfiniBand進(jìn)行高帶寬互連。
ThunderX2處理器是幾個(gè)月前才發(fā)布的一個(gè)相對(duì)較新的產(chǎn)品,選擇它的一個(gè)原因是其內(nèi)存性能高。HPE聲稱,該系統(tǒng)將提供比具有更高系統(tǒng)密度的傳統(tǒng)系統(tǒng)高出33%的內(nèi)存性能。內(nèi)存性能很重要,因?yàn)樗鰪?qiáng)了系統(tǒng)執(zhí)行超算工作負(fù)載的能力。
Astra將使用Lustre文件系統(tǒng),這是一種并行文件系統(tǒng),通過(guò)同步的、協(xié)調(diào)的輸入/輸出操作(IOPS)提供高性能訪問(wèn)能力。在存儲(chǔ)方面,Astra將部署20個(gè)全閃存HPE Apollo 4520,連接到一個(gè)容量超過(guò)400 TB的單一文件系統(tǒng)上。
Astra系統(tǒng)的功率將達(dá)到1.2兆瓦,將使用HPE的MCS 300進(jìn)行液體冷卻,這是一種液體冷卻解決方案,安裝在Apollo 70機(jī)架上。
Vildibill還提出,使用ARM處理器的決定是美國(guó)能源部在開(kāi)始尋找合作伙伴來(lái)設(shè)計(jì)和建造這個(gè)系統(tǒng)之前做出的,這表明,美國(guó)能源部的這個(gè)項(xiàng)目就是沖著ARM去的。
如上面所說(shuō),在全球頂尖的超級(jí)計(jì)算機(jī)運(yùn)算性能達(dá)到百級(jí)PFlops的當(dāng)下,Astra的表現(xiàn)并不算亮眼,但它“ARM系最強(qiáng)超級(jí)計(jì)算機(jī)”的身份不可謂不特別,而ARM架構(gòu)在超算領(lǐng)域的潛力也有待挖掘。
拋開(kāi)競(jìng)爭(zhēng)關(guān)系,美國(guó)能源部積極使用新架構(gòu)來(lái)滿足不同生產(chǎn)環(huán)境的需求的這一做法是值得肯定的。其實(shí)對(duì)超級(jí)計(jì)算機(jī)進(jìn)行排名,更多為了讓我們能夠更好地認(rèn)識(shí)這些“國(guó)之重器”,建設(shè)超級(jí)計(jì)算機(jī)耗資巨大,不能只為爭(zhēng)一口氣,要從實(shí)際情況出發(fā)。當(dāng)然,對(duì)運(yùn)算性能的追求也理應(yīng)是無(wú)窮無(wú)盡的。
特別值得一提的是,我國(guó)的下一代超級(jí)計(jì)算機(jī)——“天河三號(hào)”也在研制中,這是我國(guó)新一代百億億次超級(jí)計(jì)算機(jī)(又稱“E級(jí)超算”),它采用了自主CPU、自主操作系統(tǒng)和自主互聯(lián)通信,可以說(shuō)是自主程度最高的我國(guó)超級(jí)計(jì)算機(jī);從目前的進(jìn)展情況來(lái)看,“天河三號(hào)”有望在2020年研制成功。到時(shí),在研究人員的努力下,它將能發(fā)揮自身的最大價(jià)值。
it168網(wǎng)站原創(chuàng) 作者: 謝濤