圖1 Phoenix超級(jí)計(jì)算機(jī)標(biāo)識(shí)
Phoenix超級(jí)計(jì)算機(jī)是東方超算與北京三軸空間科技共同合作研發(fā)的水冷超級(jí)計(jì)算機(jī),部署于中國(guó)科學(xué)院大學(xué)雁西湖校區(qū),服務(wù)于物理科學(xué)學(xué)院張余洋課題組,用于基于密度泛函理論的量子力學(xué)計(jì)算研究。
Phoenix具備56個(gè)雙路英特爾至強(qiáng)鉑金級(jí)9282處理器的計(jì)算節(jié)點(diǎn),共有6272個(gè)計(jì)算核心,Linpack峰值521TFlops(每秒521萬(wàn)億次雙精度浮點(diǎn)計(jì)算能力)。
圖2 Phoenix超級(jí)計(jì)算機(jī)部署實(shí)景
整套超級(jí)計(jì)算機(jī)部署在2套機(jī)柜空間內(nèi),全部計(jì)算節(jié)點(diǎn)部署于單機(jī)柜空間;管理網(wǎng)絡(luò)、計(jì)算網(wǎng)絡(luò)、管理節(jié)點(diǎn)、登錄節(jié)點(diǎn)、存儲(chǔ)節(jié)點(diǎn)、液冷控制單元(CDU)、環(huán)控設(shè)備集中部署于另一個(gè)機(jī)柜空間內(nèi)。
集群架構(gòu)介紹:
根據(jù)基于密度泛函理論的量子力學(xué)計(jì)算的應(yīng)用運(yùn)行特征,計(jì)算節(jié)點(diǎn)配置雙路英特爾至強(qiáng)鉑金級(jí)9282處理器(單顆處理器56核心/基礎(chǔ)頻率2.6GHz/最大睿頻3.8GHz)、24條32GB內(nèi)存、1塊Omni-Path 100Gb網(wǎng)卡;系統(tǒng)管理網(wǎng)絡(luò)與硬件管理網(wǎng)絡(luò)共享板載千兆網(wǎng)卡,降低高密度部署中的網(wǎng)線密度;計(jì)算與存儲(chǔ)網(wǎng)絡(luò)配置2臺(tái)48口Omni-Path 100Gb交換機(jī),2臺(tái)交換機(jī)之間1/3阻塞,在滿足大規(guī)模計(jì)算網(wǎng)絡(luò)通信需求的基礎(chǔ)上將更多的預(yù)算用于提升計(jì)算能力。
圖3 集群計(jì)算網(wǎng)絡(luò)架構(gòu)
散熱制冷介紹:
圖4 散熱系統(tǒng)整機(jī)架構(gòu)
計(jì)算節(jié)點(diǎn)采用冷板式與風(fēng)冷雙散熱系統(tǒng)設(shè)計(jì),散熱系統(tǒng)分為三部分:1.一次側(cè)干冷式冷塔2.二次側(cè)液冷控制單元3.環(huán)境精密空調(diào)。
工作原理:
一次側(cè)干冷式冷塔:采用自然風(fēng)冷+壓縮機(jī)補(bǔ)冷方案,冬季采用自然風(fēng)冷散熱、當(dāng)自然風(fēng)冷無(wú)法滿足冷塔控制箱設(shè)定的供水溫度時(shí),壓縮器啟動(dòng)補(bǔ)冷;
二次側(cè)冷卻分配單元:通過(guò)與一次側(cè)換熱,實(shí)現(xiàn)供應(yīng)32攝氏度水給計(jì)算節(jié)點(diǎn);
環(huán)境精密空調(diào):計(jì)算節(jié)點(diǎn)運(yùn)行中處理器與內(nèi)存之外的熱量通過(guò)機(jī)箱風(fēng)扇散發(fā)至機(jī)房環(huán)境,需按照整機(jī)功耗20%來(lái)配置恒溫恒濕精密空調(diào)。
冷板貼附在處理器和內(nèi)存散熱面,依靠流經(jīng)冷板的液體將熱量帶走實(shí)現(xiàn)高效換熱,主板、網(wǎng)卡、電源供應(yīng)器等部件依靠冗余風(fēng)扇實(shí)現(xiàn)風(fēng)冷散熱。
圖5 計(jì)算節(jié)點(diǎn)機(jī)箱前/后視圖
圖6 節(jié)點(diǎn)冷卻管路/冷卻節(jié)點(diǎn)
使用Intel電源散熱實(shí)用程序PTU查看節(jié)點(diǎn)滿負(fù)載運(yùn)行的狀態(tài),32攝氏度供水的情況下CPU核心溫度為50-65攝氏度,相對(duì)于最高運(yùn)行溫度85攝氏度,供水溫度仍具有較大升溫空間。
圖7 計(jì)算節(jié)點(diǎn)滿負(fù)載運(yùn)行狀態(tài)
一次側(cè)干冷式冷塔介紹:
圖8 一次側(cè)干冷式冷塔
圖9 安裝于機(jī)房?jī)?nèi)的冷塔控制箱和一次側(cè)供回水管路
圖10 一次側(cè)干冷式冷塔控制箱界面
二次側(cè)液冷控制單元介紹:
二次側(cè)液冷控制單元采用CoolTera RM100機(jī)型,換熱量100KW,4U高度內(nèi)集成了雙循環(huán)泵和換熱器,提供了一次側(cè)進(jìn)回水口和二次側(cè)進(jìn)回水口,節(jié)省了機(jī)柜部署空間。
圖11 CDU RM100冷量分配控制器
圖12 CDU運(yùn)行狀態(tài)界面
圖13 CDU供回水管路
北京東方超算科技有限公司是全球先進(jìn)的超級(jí)計(jì)算機(jī)研發(fā)、制造和運(yùn)營(yíng)商,基于大數(shù)據(jù)、人工智能和超級(jí)計(jì)算應(yīng)用的融合計(jì)算平臺(tái),提供超級(jí)計(jì)算機(jī)應(yīng)用和服務(wù)。作為英特爾HPC數(shù)據(jù)中心專(zhuān)家,與英特爾、三軸空間和用戶(hù)合作研發(fā)超級(jí)計(jì)算機(jī)Phoenix。
北京三軸空間科技有限公司是一流的高性能計(jì)算集群建設(shè)、運(yùn)維團(tuán)隊(duì),公司自有5000余套高性能計(jì)算節(jié)點(diǎn),為科研、人工智能、影視特效等行業(yè)提供專(zhuān)業(yè)服務(wù)。三軸空間團(tuán)隊(duì)有豐富的高性能計(jì)算集群設(shè)計(jì)、運(yùn)維、行業(yè)應(yīng)用經(jīng)驗(yàn),旗下星海超算平臺(tái)、RenderG云渲染平臺(tái)在業(yè)內(nèi)享有盛譽(yù)。
免責(zé)聲明:市場(chǎng)有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買(mǎi)賣(mài)依據(jù)。
關(guān)鍵詞: