圖:華為副董事長、輪值董事長徐直軍
華為昨日在上海舉辦了一場特殊的全聯(lián)接大會,完整地公布了華為人工智能戰(zhàn)略,也公開了“達(dá)芬奇項(xiàng)目”,并且重磅發(fā)布了Ascend(昇騰)系列兩款A(yù)I芯片,震驚業(yè)界。那么昇騰芯片具體規(guī)劃是怎樣的?是否會向外界預(yù)測的那樣與芯片巨頭英偉達(dá)直接競爭?昇騰芯片與華為自家的麒麟芯片是怎樣的關(guān)系?下面,智能菌就為大家梳理華為昇騰芯片誕生的背景與歷程。
在全聯(lián)接大會上,華為將公司的人工智能發(fā)展戰(zhàn)略和盤托出,分為五個部分:
1、投資基礎(chǔ)研究:在計(jì)算視覺、自然語言處理、決策推理等領(lǐng)域構(gòu)筑數(shù)據(jù)高效(更少的數(shù)據(jù)需求)、能耗高效(更低的算力和能耗),安全可信、自動自治的機(jī)器學(xué)習(xí)基礎(chǔ)能力。
2、打造全棧方案:打造面向云、邊緣和端等全場景的、獨(dú)立的以及協(xié)同的、全棧解決方案,提供充裕的、經(jīng)濟(jì)的算力資源,簡單易用、高效率、全流程的 AI 平臺。
3、投資開放生態(tài)和人才培養(yǎng):面向全球,持續(xù)與學(xué)術(shù)界、產(chǎn)業(yè)界和行業(yè)伙伴廣泛合作,打造人工智能開放生態(tài),培養(yǎng)人工智能人才。
4、解決方案增強(qiáng):把 AI 思維和技術(shù)引入現(xiàn)有產(chǎn)品和服務(wù),實(shí)現(xiàn)更大價(jià)值、更強(qiáng)競爭力。
5、內(nèi)部效率提升:應(yīng)用 AI 優(yōu)化內(nèi)部管理,對準(zhǔn)海量作業(yè)場景,大幅度提升內(nèi)部運(yùn)營效率和質(zhì)量。
其中,華為全棧全場景AI解決方案是整個戰(zhàn)略的核心,包括四個方面:
1、基于可統(tǒng)一、可擴(kuò)展架構(gòu)的系列化AI IP和芯片Ascend。
2、芯片算子庫和高度自動化算子開發(fā)工具CANN。
3、支持端、邊、云獨(dú)立的和協(xié)同的統(tǒng)一訓(xùn)練和推理框架的MindSpore。
4、提供全流程服務(wù)ModelArts,分層API和預(yù)集成方案的應(yīng)用使能。
在這個方案中,華為自研的AI芯片算是重中之重。徐直軍表示,“如果說算力的進(jìn)步是當(dāng)下 AI 大發(fā)展的主要驅(qū)動因素,那么,算力的稀缺和昂貴正在成為制約 AI 全面發(fā)展的核心因素。”
Ascend名字在華為的使用歷程
說到Ascend這個名字,華為最早將其用在了智能手機(jī)初期。華為將Ascend分為四個系列D、P、G、Y ,分別對應(yīng)旗艦、高端、中端、入門。
2013年2月,Ascend P2發(fā)布,首次搭載了華為自家的海思K3V2四核處理器,因?yàn)?G牌照的問題,P2沒有在國內(nèi)上市。之后發(fā)布的Ascend D2,使用了相同的處理器。K3V2是海思半導(dǎo)體第一款成功市場化的手機(jī)處理器。
2013年6月,華為直接跳過了Ascend P3,在英國倫敦發(fā)布了Ascend P6手機(jī),這款手機(jī)使用了海思K3V2E四核處理器,這款處理器在華為手機(jī)產(chǎn)品中扮演了極重要的角色,成為華為手機(jī)前期的大功臣。
2014年5月,華為在法國巴黎推出Ascend P7手機(jī),搭載海思Kirin910T四核處理器。直到這時(shí),華為自家的手機(jī)處理器從海思半導(dǎo)體分拆出麒麟系列。
2015年4月,華為在英國倫敦首發(fā)P8新機(jī),搭載麒麟930/麒麟935處理器。這個時(shí)候,華為在手機(jī)中開始慢慢淡化Ascend,而直接以P系列來命名手機(jī)。
Ascend芯片的五大系列和規(guī)劃
現(xiàn)在的Ascend(昇騰)芯片是華為“達(dá)芬奇項(xiàng)目”的一部分,也是華為全棧人工智能解決方案的一部分。
Ascend是基于可統(tǒng)一、可擴(kuò)展架構(gòu)的系列化AI IP和芯片,昇騰芯片包括Max,Mini,Lite,Tiny和Nano等五個系列,基于“達(dá)芬奇架構(gòu)”制造。
本次發(fā)布了兩款昇騰芯片,分別是昇騰910(Ascend 910),昇騰310(Ascend 310)。
徐直軍表示,昇騰910屬于Max系列,是目前發(fā)布的所有芯片中,計(jì)算密度最大的單芯片。該芯片采取7nm工藝制程,最大功耗為350W。“昇騰910可以達(dá)到256個T,是目前全球已發(fā)布單芯片數(shù)最大的AI芯片,比最近英偉達(dá)的V100還要高出1倍。”徐直軍表示。
昇騰310(Ascend 310)屬于Mini系列,是目前面向計(jì)算場景最強(qiáng)算力的AI SoC。昇騰310是昇騰迷你系列的第一款產(chǎn)品。據(jù)稱這款芯片功耗為8瓦,采用12nm 工藝,算力可達(dá)16TFLOPS,其集成了16通道全高清視頻解碼器。
此外,徐直軍還推出了5款基于昇騰310芯片的AI產(chǎn)品,包括AI加速模塊Atlas 200、AI加速卡Atlas 300、AI智能小站Atlas 500、AI一體機(jī)Atlas 800、以及移動數(shù)據(jù)中心MDC 600。
Lite、Tiny和Nano三個系列芯片將在明年發(fā)布。
在發(fā)布芯片的同時(shí),華為還發(fā)布了大規(guī)模分布式訓(xùn)練系統(tǒng) Ascend 集群,在設(shè)計(jì)中,該集群將包括 1024個 Asced 910芯片,算力達(dá)到 256P,大幅超過英偉達(dá) DGX2 和谷歌 TPU 集群。這種服務(wù)器將同樣在 2019 年二季度推出,幫助開發(fā)者更快地訓(xùn)練模型。
以下是外界對于華為AI芯片最關(guān)心的問題:
昇騰芯片將來是否會與英偉達(dá)直接競爭?
這此發(fā)布的兩款芯片都會在2019年第二季度上市,但徐直軍在隨后的媒體采訪環(huán)節(jié)表示,華為兩款A(yù)I芯片均不會單獨(dú)對外銷售,而是以AI加速模塊、AI服務(wù)器、云服務(wù)的形式面向第三方銷售。
徐直軍表示,“我們不直接向第三方提供芯片,而是提供基于芯片的硬件和云服務(wù),我們和純芯片廠商沒有直接競爭。”
為何要自研架構(gòu),而不采用寒武紀(jì)等合作伙伴方案?
對于外界一直疑問的華為為何要搭建自己的”達(dá)芬奇架構(gòu)“,而不用寒武紀(jì)等廠商的方案。徐直軍在采訪中回答到,“構(gòu)建新架構(gòu)來支持人工智能芯片,是因?yàn)檫@是基于華為對人工智能的理解,基于端管云對對人工智能的需求自然產(chǎn)生的。”
徐直軍表示,華為需要覆蓋從云、到邊緣、到端到物聯(lián)網(wǎng)端,需要全新的架構(gòu),創(chuàng)造力的架構(gòu)。“寒武紀(jì)也很好,但無法支持我們的全場景。”
華為首席架構(gòu)師黨文栓介紹說,Ascend 芯片采用統(tǒng)一達(dá)芬奇架構(gòu):可擴(kuò)展計(jì)算、可擴(kuò)展內(nèi)存、可擴(kuò)展片上互聯(lián)。因此,這是全球首個覆蓋全場景的智能芯片系列。
華為為何一直如此專注開發(fā)AI芯片?
徐直軍認(rèn)為,在目前數(shù)據(jù)隱私保護(hù)形勢下,很多事情無法單獨(dú)由云上的計(jì)算力完成,必須要在端側(cè)去完成。這是非常復(fù)雜的多目標(biāo)的優(yōu)化問題。
“這往往要面對能耗和內(nèi)存的雙重限制,面對各種場景下的不同需求。比如在車載應(yīng)用中要求響應(yīng)速度很快,對各種圖片和視頻的處理精確度要求比較高,在聲音方面,降噪的要求就非常高,如何能夠利用GAN的方式去把聲紋和內(nèi)容分開,這中間往往牽扯到個人隱私。”徐直軍說到,華為主要目的是要在端側(cè)方面開發(fā)出高性能的芯片,將盡量多的處理過程在端側(cè)完成,爭取提供最好的用戶體驗(yàn)。
麒麟芯片和昇騰芯片是怎樣的關(guān)系?
接近華為的人士表示,麒麟芯片將主打手機(jī)處理器,昇騰芯片主要是配合云服務(wù)來使用,像昇騰310這樣的芯片雖然未來也會用于手機(jī)、手表等設(shè)備,但大多是需要低功耗的地方。對此,華為一名Fellow稱,二者關(guān)系保密,明年揭曉。