“中國有多少數(shù)學(xué)家投入到人工智能的基礎(chǔ)算法研究中?”日前,在上海召開的院士沙龍活動中,中國工程院院士徐匡迪等多位院士的發(fā)問引發(fā)業(yè)界共鳴,被稱為“徐匡迪之問”。
“我國人工智能領(lǐng)域真正搞算法的科學(xué)家鳳毛麟角。”在4月28日召開的“超聲大數(shù)據(jù)與人工智能應(yīng)用與推廣大會”上,東南大學(xué)生物科學(xué)與醫(yī)學(xué)工程學(xué)院教授萬遂人表示,“徐匡迪之問”直擊我國人工智能發(fā)展的核心關(guān)鍵問題,“如果這種情況不改變,我國人工智能應(yīng)用很難走向深入、也很難獲得重大成果”。
我國人工智能領(lǐng)域發(fā)展的現(xiàn)狀如何?依靠開源代碼和算法是否足夠支撐人工智能產(chǎn)業(yè)發(fā)展?為什么要有自己的底層框架和核心算法?
缺少核心算法,會被“卡脖子”
“如果缺少核心算法,當(dāng)碰到關(guān)鍵性問題時(shí),還是會被人‘卡脖子’。”浙江大學(xué)應(yīng)用數(shù)學(xué)研究所所長孔德興教授對科技日報(bào)記者表示,我國人工智能產(chǎn)業(yè)的創(chuàng)新能力并沒有傳說中的那樣強(qiáng),事實(shí)是,產(chǎn)業(yè)發(fā)展過度依賴開源代碼和現(xiàn)有數(shù)學(xué)模型,真正屬于中國自己的東西并不多。
4個(gè)月零基礎(chǔ)學(xué)會人工智能、16講入門人工智能、算法線下大課……類似培訓(xùn)在網(wǎng)絡(luò)上非常火爆,通過對于現(xiàn)有算法、模型的學(xué)習(xí)和訓(xùn)練,成長為人工智能工程師的“短平快”可見一斑。
既然代碼是開源的,拿來用就好,為什么還有可能被“卡脖子”?
孔德興解釋,開源代碼是可以拿過來使用,但專業(yè)性、針對性不夠,效果往往不能滿足具體任務(wù)的實(shí)際要求。以圖像識別為例,用開源代碼開發(fā)出的AI即使可以準(zhǔn)確識別人臉,但在對醫(yī)學(xué)影像的識別上卻難以達(dá)到臨床要求。“例如對肝臟病灶的識別,由于邊界模糊、對比度低、器官黏連甚至重疊等困難,用開源代碼很難做到精準(zhǔn)識別。在三維重構(gòu)、可視化等方面難以做到精準(zhǔn)反應(yīng)真實(shí)的解剖信息,甚至?xí)霈F(xiàn)誤導(dǎo)等問題,這在醫(yī)學(xué)應(yīng)用上是‘致命’的。”
“碰到專業(yè)性高的研究任務(wù),一旦被‘卡脖子’將會是非常被動的,所以一定要有自己的算法。”孔德興說。換句話說,是否掌握核心代碼將決定未來的AI“智力大比拼”中是否擁有勝算。用開源代碼“調(diào)教”出的AI頂多是個(gè)“常人”,而要幫助AI成長為“細(xì)分領(lǐng)域?qū)<?rdquo;,需以數(shù)學(xué)為基礎(chǔ)的原始核心模型、代碼和框架創(chuàng)新。
有算法之“根”才能撐起產(chǎn)業(yè)“繁茂”
所謂“樹大根深”,人工智能的發(fā)展也是同樣道理,越在底層深深扎下根基,越能夠發(fā)展出強(qiáng)大的產(chǎn)業(yè)。
那么,借助開源代碼,“半路出家”的AI產(chǎn)業(yè)為什么會難以為繼?
孔德興解釋說,在獲得同樣數(shù)據(jù)的前提下,以開源代碼運(yùn)行,AI深度學(xué)習(xí)之后或許能輸出結(jié)果,但由于訓(xùn)練框架固定、算法限制,當(dāng)用戶進(jìn)行具體的實(shí)際應(yīng)用時(shí),將很難達(dá)到所期望的結(jié)果,而且難以修改、完善、優(yōu)化算法。
“如果從底層算法做起,那么整個(gè)數(shù)學(xué)模型、整個(gè)算法設(shè)計(jì)、整個(gè)模擬訓(xùn)練‘一脈相承’,不僅可以協(xié)同優(yōu)化,而且可以根據(jù)需求隨時(shí)修改,從而真正解決實(shí)際問題。”孔德興說,基礎(chǔ)算法往往是指研究共性問題的算法,它涉及到基礎(chǔ)數(shù)學(xué)理論、高性能數(shù)值計(jì)算等學(xué)科,可以應(yīng)用到多種實(shí)際問題中;而針對性強(qiáng)的應(yīng)用算法往往會應(yīng)用到具體問題所涉及的“具體知識、先驗(yàn)信息”,從而更好地解決實(shí)際應(yīng)用問題。
“基礎(chǔ)算法和應(yīng)用算法都很重要,擁有基礎(chǔ)算法將更有助于應(yīng)用算法的豐富與深入。”孔德興說,AI要應(yīng)對的現(xiàn)實(shí)生活是復(fù)雜、多變的,當(dāng)能夠“應(yīng)對自如”時(shí),才能夠促成產(chǎn)業(yè)的“繁茂”。
呼吁三方協(xié)力,讓數(shù)學(xué)不再置身事外
“一方面是政策引導(dǎo),其實(shí)國家已經(jīng)在加大這方面的扶持,例如科研基金上的設(shè)置等。”針對如何解決“徐匡迪之問”反映出來的問題,孔德興認(rèn)為,第二方面是行業(yè)企業(yè)在進(jìn)行科技創(chuàng)新時(shí),應(yīng)有意識將數(shù)學(xué)學(xué)者納入進(jìn)來。
“如果通過算法的開發(fā),最終產(chǎn)品落地了,企業(yè)應(yīng)該將算法開發(fā)時(shí)的數(shù)學(xué)學(xué)者納入到成果分享中來。”孔德興說,社會目前對于數(shù)學(xué)科學(xué)等“軟實(shí)力”的認(rèn)可程度不足,行業(yè)或法規(guī)層面應(yīng)該做好數(shù)學(xué)研究成果的產(chǎn)權(quán)保護(hù)工作。
“第三方面,數(shù)學(xué)家本身應(yīng)該積極參與到人工智能發(fā)展的浪潮里。”孔德興呼吁,AI的未來發(fā)展需要數(shù)學(xué)家深度參與。由于目前仍處于“弱人工智能”時(shí)代(可以說是數(shù)據(jù)智能時(shí)代),AI的實(shí)現(xiàn)主要是依賴計(jì)算機(jī)的巨大算力和巨大的存儲能力,底層算法的問題或許并不突出,但在未來的發(fā)展,AI將可能融入邏輯、思維等智慧的內(nèi)容,這些都需要數(shù)學(xué)科學(xué)的原始創(chuàng)新,有大量的基礎(chǔ)問題亟待數(shù)學(xué)家攻克。
算法的進(jìn)階一定是來源于“原創(chuàng)者”,而不是“跟隨者”。孔德興說:“實(shí)際上深度學(xué)習(xí)的應(yīng)用已遇到了天花板,我們需要新的數(shù)學(xué)技術(shù)(如部分依賴邏輯、部分依賴數(shù)據(jù)的‘聰明算法’),讓計(jì)算機(jī)變得聰明起來。這些工作都需要數(shù)學(xué)家的參與。”(張佳星)