最近產(chǎn)業(yè)中最愛玩的一個游戲,就是“AI在哪”。以往我們能看到AI存在于實驗室內(nèi)、存在于軟件之中,但想要讓AI從模型走進現(xiàn)實,往往沒那么容易。最起碼的,AI任務(wù)需要一系列條件去支撐,其細節(jié)建立在各種ICT基礎(chǔ)設(shè)施的迭代之上?;蛟S可以這樣比喻,AI就像汽車,當(dāng)它到來時,配套的高速路加油站修車廠都要建好。馬車時代的路況,是無法發(fā)揮汽車任何優(yōu)勢的。
AI走到現(xiàn)實的重要條件有很多,尤其需要注意的是,AI必然建立在ICT基礎(chǔ)設(shè)施之上,通過網(wǎng)絡(luò)空間延展到萬物智能應(yīng)用當(dāng)中??梢哉f,AI的運轉(zhuǎn)與網(wǎng)絡(luò)環(huán)境息息相關(guān),網(wǎng)絡(luò)是AI的行軍之路。然而在AI的兵馬到來之際,網(wǎng)絡(luò)環(huán)境這條運兵棧道真的已經(jīng)修建好了嗎?如果我們分析一下今天AI面臨的“網(wǎng)絡(luò)路況”,會發(fā)現(xiàn)其中孕育著很多痛點。同時,一個智能時代的產(chǎn)業(yè)機遇也蘊藏其中。
AI時代的前夜,網(wǎng)絡(luò)表示“壓力山大”
我們相信AI時代會在明晨到來,那么今天就是AI時代的前夜。
這個漫長的前夜里,AI應(yīng)用正在為ICT基礎(chǔ)設(shè)施提出越來越多的挑戰(zhàn)。
首先AI運算相比以往的運算更加復(fù)雜,一次智能化識別的背后可能包含著幾百個模型的計算。能夠承擔(dān)更復(fù)雜的運算任務(wù),顯然是AI應(yīng)用ICT基礎(chǔ)設(shè)施的第一要務(wù)。
同時AI運算往往關(guān)乎于圖像、關(guān)乎于視頻,其數(shù)據(jù)量的龐大程度相比以往實現(xiàn)了從線性到張量的躍進。能承擔(dān)更大的數(shù)據(jù)通過量才能讓AI應(yīng)用平穩(wěn)運行。
最后AI運算對于ICT基礎(chǔ)設(shè)施的部署條件要求也更加嚴(yán)苛,以往以太網(wǎng)1‰的丟包率,對于AI應(yīng)用來說會極大的影響其算力發(fā)揮。
這些AI給計算和通信帶來的改變,同時也給通行的網(wǎng)絡(luò)環(huán)境施加了巨大的負擔(dān)。無論是智能駕駛這樣的巨大數(shù)據(jù)量任務(wù),還是工業(yè)互聯(lián)網(wǎng)精準(zhǔn)的算法模型部署要求,或者AIoT駁雜的運維壓力,都給網(wǎng)絡(luò)環(huán)境添加了無數(shù)壓力。
面對AI的到來,網(wǎng)絡(luò)環(huán)境的痛點可以體現(xiàn)在這樣幾個方面:
1、龐大算力需要和復(fù)雜的異構(gòu)計算,需要彈性的網(wǎng)絡(luò)環(huán)境支撐,網(wǎng)絡(luò)速度跟不上,AI算力也就無的放矢。
2、AI任務(wù)要求大規(guī)模部署和并行計算、海量非結(jié)構(gòu)化數(shù)據(jù)通過、實時學(xué)習(xí)、算法在框架層和應(yīng)用層的精準(zhǔn)度一致等等。這些新要求是此前的網(wǎng)絡(luò)環(huán)境中所不具備的,需要新的主動網(wǎng)絡(luò)優(yōu)化能力。
3、AI時代,企業(yè)業(yè)務(wù)空間增長,并行數(shù)據(jù)量暴增,直接導(dǎo)致運維工作太過復(fù)雜,解放這一壓力,也已經(jīng)刻不容緩。
這三大痛點之下,直接的結(jié)果是網(wǎng)絡(luò)交換機市場迎來了全新的挑戰(zhàn),同時也是市場迭代的深刻機遇。具有AI支撐能力、智能運維能力的次世代網(wǎng)絡(luò)交換機,成為了今天AI大局中的當(dāng)務(wù)之急。
引入CloudEngine 16800作為華為AI發(fā)展戰(zhàn)略以及全棧全場景AI解決方案中的新成員,通過創(chuàng)造性地在交換機中安裝AI芯片,通過智能優(yōu)化和本地決策獲取自動駕駛網(wǎng)絡(luò)能力。加上單槽48 x 400GE高密端口,可以最大化支持AI運算的高密度流量,把網(wǎng)絡(luò)環(huán)境建設(shè)推向了AI時代的新層次。
CloudEngine 16800背后,華為解決了AI前夜的兩個重要問題:讓現(xiàn)在簡單,讓未來通順。
更簡單的今天:用AI之力扭轉(zhuǎn)網(wǎng)絡(luò)運維困境
分析通過安裝AI芯片,CloudEngine 16800首創(chuàng)在交換機當(dāng)中添加AI算力,在設(shè)備層面集成了智能化的主動識別和實施決策能力。在這種能力之下,可以實現(xiàn)秒級故障識別和分鐘級故障自動定位。
而這一功能為應(yīng)用者帶來的第一個改變,就在于將可以用AI的智慧來完成運維工作,將今天與日俱增的運維壓力釋放出來。
用AI來承擔(dān)原本耗費大量人力,并且逐漸已經(jīng)無法為人類所完成的網(wǎng)絡(luò)運維工作,可以看作幾個梯段達成的目標(biāo)。
在CloudEngine 16800的AI引擎解決方案中,首先完成的是智能診斷的本地化,通過CloudEngine 16800的本地推理和實時決策,用AI承擔(dān)運維工作,減少對云服務(wù)診斷的依賴,實現(xiàn)低成本高效率。
接下來,基于智能化運維和故障檢測,以及專業(yè)故障庫的智能匹配,達成故障主動排查,主動監(jiān)控的能力。將人工難以完成的復(fù)雜網(wǎng)絡(luò)運維監(jiān)控承擔(dān)下來。
此外,通過智能運維平臺和交換機本地智能構(gòu)成的分布式AI運維架構(gòu)的配合,實現(xiàn)故障快速自我修復(fù),完成從本地分析到自我愈合的完整AI網(wǎng)絡(luò)運維體系。整個網(wǎng)絡(luò)系統(tǒng)開始接近“自動駕駛”狀態(tài),將用戶從不斷復(fù)雜的網(wǎng)絡(luò)運維中解放出來,從而更加關(guān)注場景和應(yīng)用,而不是消耗大量人力物力在后勤保障上。當(dāng)以往的困境被改變,整個網(wǎng)絡(luò)運維系統(tǒng)的靈活性和可部署性也會隨之提高。過去傷筋動骨式的維修、擴展將不再重現(xiàn)。
換言之,在AI之力的影響下。交換機的應(yīng)用模式會一改往日的沉重復(fù),變得更加輕盈、更加簡單。
智能優(yōu)化之下,更多想象力的未來
對于網(wǎng)絡(luò)環(huán)境來說,今天更大的任務(wù)是要適應(yīng)企業(yè)用戶不斷增大的AI算力需求,以及衍生的網(wǎng)絡(luò)依賴。網(wǎng)絡(luò)環(huán)境必須為AI任務(wù)大量普及,提供必要的網(wǎng)絡(luò)支持。不能等到數(shù)據(jù)泛濫,深度學(xué)習(xí)應(yīng)用迫在眉睫,才發(fā)現(xiàn)原來路還沒鋪好。
基于AI芯片帶來的主動分析能力和實時學(xué)習(xí)能力,CloudEngine 16800應(yīng)用上了華為獨創(chuàng)的iLossLess智能無損交換算法,提供網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化和全網(wǎng)調(diào)度能力,滿足復(fù)雜AI任務(wù)在運行時需要的網(wǎng)絡(luò)空間。這一能力對于AI開發(fā)者和運用者來說,將針對未來越來越廣泛的AI需求,解決三大底層問題:
1、 解決以太網(wǎng)原生短板的丟包問題,提升AI任務(wù)精度以及場景一致性。應(yīng)用上智能無損交換算法后,可以讓以太網(wǎng)實現(xiàn)零丟包,充分發(fā)揮AI算力,不會在從任務(wù)到場景的過程中產(chǎn)生誤差。
2、通過靈活的網(wǎng)絡(luò)調(diào)度,加速AI任務(wù)訓(xùn)練,加快模型部署效率。同樣在智能無損交換算法下,數(shù)據(jù)中心可以根據(jù)流量模型實現(xiàn)自適應(yīng)和自優(yōu)化,根據(jù)應(yīng)用狀況自主進行資源調(diào)度,更加適應(yīng)AI應(yīng)用流量彈性空間較大的特征。
3、基于AI開發(fā)平臺,讓IT人員更好的加入AI,從另一個維度降低開發(fā)成本,最終實現(xiàn)AI快速低成本落地。這種更加普惠的模式,在企業(yè)進行智能化轉(zhuǎn)型時,提供了強大的推助力。
AI時代,并不只是算法的時代,同時也是滿足于AI運行,能夠把AI效能最大化的系列技術(shù)共同的時代。
此刻我們需要的不僅僅是AI技術(shù)本身的發(fā)展,還有一切與其相關(guān)技術(shù)的合力前行。其中,網(wǎng)絡(luò)基礎(chǔ)環(huán)境就是至關(guān)重要的一項。新一代的網(wǎng)絡(luò)產(chǎn)品,必須比等待中的產(chǎn)業(yè)格局走到更前面。而在產(chǎn)業(yè)智能化轉(zhuǎn)型的革命征程中,網(wǎng)絡(luò)產(chǎn)品絕非是在基層供給燃料的后備軍,而是要充當(dāng)起先鋒和開路者的角色,才能讓這條漫長的征程走得更加順?biāo)臁?/p>