8月18日,中國算力大會在銀川盛大開幕,在“智算無限全棧智能聯(lián)想AI算力戰(zhàn)略暨AI服務(wù)器新品發(fā)布會”上,聯(lián)想重磅發(fā)布兩款全新AI服務(wù)器產(chǎn)品——聯(lián)想問天WA7780 G3 AI大模型訓(xùn)練服務(wù)器和聯(lián)想問天WA5480 G3 AI訓(xùn)推一體服務(wù)器。
這兩款服務(wù)器是基于AI導(dǎo)向打造的全新產(chǎn)品,能夠助力構(gòu)建更加綠色高效的人工智能數(shù)據(jù)中心,滿足客戶從訓(xùn)練到推理等多樣的算力需求。
AI賦智,綠色賦能:打造AI導(dǎo)向的算力基礎(chǔ)設(shè)施,領(lǐng)跑中國智能化變革
(資料圖)
近年來,在“建設(shè)數(shù)字中國”的背景下,中國算力基礎(chǔ)設(shè)施的“地基”快速發(fā)展,行業(yè)智能化轉(zhuǎn)型迎來進一步深化。與此同時,據(jù)IDC報告顯示,隨著生成式人工智能應(yīng)用的爆發(fā),各行業(yè)對智算的需求首次超過通用算力1,AI算力已成為算力發(fā)展的主要方向。
今年年初,聯(lián)想發(fā)布了聯(lián)想服務(wù)器的首個本地化品牌“聯(lián)想問天”,以“本地創(chuàng)新、敏捷高效”為品牌內(nèi)涵,更好地滿足中國本土客戶的個性化需求。聯(lián)想通過AI導(dǎo)向的算力基礎(chǔ)設(shè)施,加速人工智能進入千行百業(yè)、覆蓋多元場景,最終實現(xiàn)普適、智慧相融合,引領(lǐng)算力行業(yè)走向普適、智慧和綠色的新未來。
會上,聯(lián)想集團副總裁、聯(lián)想中國區(qū)基礎(chǔ)設(shè)施業(yè)務(wù)群服務(wù)器事業(yè)部總經(jīng)理陳振寬表示:“在通用算力向AI算力發(fā)展的當(dāng)下,聯(lián)想問天WA7780 G3 AI大模型訓(xùn)練服務(wù)器和聯(lián)想問天WA5480 G3 AI訓(xùn)推一體服務(wù)器兩款新品將分別滿足不同類型的AI應(yīng)用場景需求?!?/p>
聯(lián)想問天WA7780 G3 AI大模型訓(xùn)練服務(wù)器:性能強勁,靈活高效
聯(lián)想問天WA7780 G3是一款專為AI大模型訓(xùn)練所打造的服務(wù)器。AI算力已成為企業(yè)訓(xùn)練開發(fā)使用人工智能的硬門檻。聯(lián)想問天WA7780 G3 AI大模型訓(xùn)練服務(wù)器正是為打破AI算力供給困境而來,為訓(xùn)練提供強勁的算力支撐。
澎湃算力
聯(lián)想問天WA7780 G3 AI大模型訓(xùn)練服務(wù)器基于第四代英特爾?至強?可擴展處理器。NVIDIA HGX H800系統(tǒng)配備8顆H800 NVLink GPU,擁有高達640GB的HBM3高速顯存,通過NVLINK,GPU間互聯(lián)帶寬高達400GB/s。將AI算力提升了3.44倍,至高可達32P FLOPS AI算力。NVIDIA H800 GPU匹配第四代TensorCore配合Transformer引擎(FP8精度),與上一代產(chǎn)品相比,可為大模型AI訓(xùn)練速度帶來高達9倍提升,可將大模型AI推理速度提升高達30倍。
靈活架構(gòu)
聯(lián)想問天WA7780 G3 AI大模型訓(xùn)練服務(wù)器,為了滿足AI超大模型訓(xùn)練場景下,GPU服務(wù)器間高速數(shù)據(jù)通信的需求,支持IB、RoCE等多種對外網(wǎng)絡(luò)連接方案。最高可以支持8張RDMA高速網(wǎng)卡,提供3.2Tb/s聚合帶寬。充分滿足了超大模型訓(xùn)練并行計算時,跨節(jié)點的通信需求。同時,在本地存儲的設(shè)計上,采用了GPU Direct Storage (GDS)技術(shù)。通過GDS技術(shù),GPU與NVMe實現(xiàn)了快速低延遲互聯(lián),能夠有效提高訓(xùn)練數(shù)據(jù)載入的速度,提升大模型訓(xùn)練的性能。
節(jié)能高效
聯(lián)想問天WA7780 G3 AI大模型訓(xùn)練服務(wù)器,在產(chǎn)品設(shè)計中采用了三重獨立風(fēng)道設(shè)計,針對不同部件的散熱特征,進行了系統(tǒng)性的優(yōu)化,有效降低了由風(fēng)扇帶來的散熱功耗。相比同級別產(chǎn)品,聯(lián)想問天WA7780 G3 AI大模型訓(xùn)練服務(wù)器功耗降低約10%。同時,為了滿足未來智算中心對PUE值更低的要求,本產(chǎn)品預(yù)留了液冷冷板設(shè)計,未來將支持液冷,這將大幅度節(jié)省在AI大模型訓(xùn)練過程中,因系統(tǒng)散熱帶來的額外能耗,PUE值有望低于1.1。
聯(lián)想問天WA5480 G3 AI訓(xùn)推一體服務(wù)器:多元豐富,穩(wěn)定可靠
從機器視覺、推薦系統(tǒng),自然語言處理,再到更為復(fù)雜的AI大模型,不同AI應(yīng)用場景對于AI服務(wù)器有著不同要求。本次發(fā)布會一同亮相的聯(lián)想問天WA5480 G3 AI訓(xùn)推一體服務(wù)器,是聯(lián)想問天品牌中的一款4U機架式AI服務(wù)器,支持多元的算力和豐富的生態(tài),能夠為AI模型的訓(xùn)練推理提供極致可靠的算力,加速人工智能在千行百業(yè)的落地,從而推動各行業(yè)乃至整個社會的智能化變革進程。
多元算力
聯(lián)想問天WA5480 G3 AI訓(xùn)推一體服務(wù)器采用2顆第四代英特爾至強可擴展處理器,支持最新PCIe5.0。通過PCIe擴展,最多可以支持10張包括最新NVIDIA H800 GPU在內(nèi)的,多類型、多品牌AI加速卡??梢造`活應(yīng)用于AI通用模型訓(xùn)練、大模型推理、AI生成、云游戲、科學(xué)計算等多種應(yīng)用場景,為AI的多樣場景提供多元算力。
靈活拓撲
聯(lián)想問天WA5480 G3 AI訓(xùn)推一體服務(wù)器在CPU-GPU互聯(lián)的硬件設(shè)計上也充分體現(xiàn)了靈活多變的設(shè)計理念。聯(lián)想問天WA5480 G3 AI訓(xùn)推一體服務(wù)器基于不同AI工作負載,可以為客戶提供包括直通、Balance、Common多種CPU-GPU互聯(lián)方式,避免了因為CPU-GPU數(shù)據(jù)通信方式單一與工作負載不匹配,帶來的潛在性能瓶頸和系統(tǒng)效率下降。結(jié)合不同種類,不同數(shù)量的加速卡選擇,真正實現(xiàn)了對AI各種復(fù)雜場景的完美匹配。
極致可靠
聯(lián)想問天WA5480 G3 AI訓(xùn)推一體服務(wù)器充分考慮了設(shè)計冗余,為AI算力提供了安全穩(wěn)定的運行環(huán)境。支持電源N+N冗余,節(jié)點內(nèi)電源間互為備份,對外可以連接雙路市電,保障服務(wù)器24小時在線運行。支持CPU、GPU、內(nèi)存等關(guān)鍵部件的功耗監(jiān)測,整機功耗封頂調(diào)控,動態(tài)保障服務(wù)器運行在合理的功耗區(qū)間,保證性能的穩(wěn)定,以及風(fēng)扇N+1冗余等多種安全設(shè)計保障高環(huán)溫?zé)o間斷運行。
這兩款A(yù)I服務(wù)器新品是“聯(lián)想問天”品牌家族重要的組成部分,傳承了聯(lián)想服務(wù)器高性能、高可靠、高擴展、低功耗“三高一低”的特性,具備“本地創(chuàng)新、敏捷高效”的品牌內(nèi)涵。未來,聯(lián)想問天WA7780 G3 AI大模型訓(xùn)練服務(wù)器和聯(lián)想問天WA5480 G3 AI訓(xùn)推一體服務(wù)器將與聯(lián)想其它AI基礎(chǔ)設(shè)施產(chǎn)品組合多向賦能,助力AI算力覆蓋AI全域應(yīng)用。同時,配合聯(lián)想領(lǐng)先的液冷技術(shù),聯(lián)想AI導(dǎo)向的算力基礎(chǔ)設(shè)施,將持續(xù)助力AI算力綠色賦能,為普慧算力鑄造牢固的“基石”。
關(guān)鍵詞: