觀點(diǎn)速讀
伴隨生成式人工智能的迅猛發(fā)展,我們正迎來人工智能第三次浪潮的高峰期。DeepSeek的推出,成為世界人工智能發(fā)展史上的一個(gè)標(biāo)志性事件,為在受限資源下探索通用人工智能開辟了新的路徑。發(fā)展人工智能需要充足的算力和高質(zhì)量數(shù)據(jù),必須構(gòu)建自主可控的AI基礎(chǔ)設(shè)施生態(tài)來保障資源供給?!度嗣襦]電報(bào)》記者特邀中國(guó)工程院院士李國(guó)杰暢談AI發(fā)展策略。
發(fā)展人工智能重在落地行業(yè)
人工智能是對(duì)人類智能某方面的再現(xiàn)和超越,其通用性是相對(duì)的,需基于特定條件或范圍。大模型追求的通用人工智能(AGI)只是眾多通用目標(biāo)的一種。我們要認(rèn)識(shí)人工智能的局限性,不能盲目追求天下通吃的人工智能,重點(diǎn)還是要根據(jù)實(shí)際需求,將相對(duì)通用的人工智能技術(shù)落地到各行業(yè),讓一定范圍內(nèi)的人工智能技術(shù)見到實(shí)效。
斯坦福大學(xué)《2024年人工智能指數(shù)報(bào)告》明確指出,機(jī)器學(xué)習(xí)大模型在圖像分類、視覺推理及英語(yǔ)理解等方面的表現(xiàn)已超過人類。聊天機(jī)器人和其他智能軟件正改變我們的工作和生活。AI驅(qū)動(dòng)的科學(xué)研究作為科研第五范式,也展現(xiàn)出驚人潛力。比如DeepMind的Alpha-Fold3已成功預(yù)測(cè)地球上已知的超兩億種蛋白質(zhì)的三維結(jié)構(gòu),有望顛覆當(dāng)前的藥物研發(fā)模式,其發(fā)明者獲得了2024年諾貝爾化學(xué)獎(jiǎng)。人們相信,智能技術(shù)的指數(shù)性發(fā)展一定會(huì)加速通用人工智能的到來,但自適應(yīng)性、持續(xù)學(xué)習(xí)及與外界互動(dòng)等問題仍需克服。
實(shí)現(xiàn)通用智能是一個(gè)漸進(jìn)過程,不會(huì)因某項(xiàng)技術(shù)的發(fā)明就突然到來。盡管當(dāng)前AI的通用性比前兩波有顯著提高,但距離真正的通用智能還有較大差距。在某些應(yīng)用中通過圖靈測(cè)試只是階段性成果,發(fā)展既通用自主又安全放心的人工智能仍是巨大挑戰(zhàn)。
DeepSeek開辟新路徑
DeepSeek的推出成為世界人工智能發(fā)展史上的一個(gè)標(biāo)志性事件,不僅創(chuàng)下了全球用戶增長(zhǎng)速度的新紀(jì)錄,還引發(fā)了市場(chǎng)對(duì)相關(guān)硬件需求預(yù)期的調(diào)整。例如,英偉達(dá)的股價(jià)短期內(nèi)有所波動(dòng),反映了市場(chǎng)對(duì)新興技術(shù)可能帶來的行業(yè)變革的敏感性。這也表明中國(guó)科技公司在全球最關(guān)注的核心技術(shù)領(lǐng)域,正通過持續(xù)創(chuàng)新重塑世界既有格局。
DeepSeek為在受限資源下探索通用人工智能開辟了新的路徑。傳統(tǒng)大模型通常從廣泛的通用能力出發(fā),逐漸向特定應(yīng)用場(chǎng)景優(yōu)化。相比之下,DeepSeek采取了一種不同的策略,通過專注于特定任務(wù)或領(lǐng)域,逐步擴(kuò)展其通用能力。這種方法有助于推動(dòng)人工智能技術(shù)生態(tài)的發(fā)展,并促進(jìn)通用人工智能的社會(huì)共享。“小而精”模型將AI的應(yīng)用重點(diǎn)從面向企業(yè)轉(zhuǎn)向面向消費(fèi)者,從廣泛覆蓋轉(zhuǎn)變?yōu)樯疃葍?yōu)化,讓更多的中小企業(yè)參與,可能創(chuàng)造更大的市場(chǎng)空間。這種“垂直深潛”策略與通用大模型的“橫向擴(kuò)展”互為補(bǔ)充,共同構(gòu)建智能時(shí)代的創(chuàng)新生態(tài)。
長(zhǎng)期以來,中國(guó)AI企業(yè)側(cè)重于應(yīng)用和商業(yè)模式創(chuàng)新,追求快速盈利,較少涉足核心技術(shù)的原創(chuàng)性突破。與西方發(fā)達(dá)國(guó)家相比,我們真正的差距不在于資金或硬件的短缺,而在于缺乏原創(chuàng)技術(shù)和發(fā)明,以及在增強(qiáng)信心和有效組織高水平人才進(jìn)行創(chuàng)新方面的能力不足。隨著經(jīng)濟(jì)的發(fā)展和技術(shù)的積累,中國(guó)企業(yè)逐漸增強(qiáng)了原創(chuàng)研發(fā)能力。DeepSeek開了一個(gè)好頭,他們把探索通用人工智能的實(shí)現(xiàn)之路作為奮斗目標(biāo),并吸引了一批充滿創(chuàng)新熱情和好奇心的年輕博士加入。這些“90后”的中國(guó)青年展現(xiàn)出與西方同行平等對(duì)話的信心和“敢為天下先”的勇氣,成為中國(guó)科技自主創(chuàng)新能力發(fā)展的希望。
構(gòu)建自主可控的基礎(chǔ)設(shè)施生態(tài)
發(fā)展人工智能需要充足的算力和高質(zhì)量數(shù)據(jù),必須構(gòu)建自主可控的AI基礎(chǔ)設(shè)施生態(tài)來保障資源供給。
美國(guó)的AI基礎(chǔ)設(shè)施是基于英偉達(dá)的GPU建立起來的。我國(guó)的人工智能加速芯片,如華為的昇騰、海光的DCU和寒武紀(jì)的芯片與GPU芯片的硬件性能差距并不是很大。英偉達(dá)的核心優(yōu)勢(shì)在于CUDA軟件生態(tài)及NVLink和InfiniBand高速互聯(lián),其中CUDA生態(tài)最難攻克。DeepSeek雖沖擊了CUDA生態(tài),但沒有完全繞過CUDA,CUDA的生態(tài)壁壘仍然存在。從長(zhǎng)遠(yuǎn)來講,我們需要開發(fā)一套比CUDA更優(yōu)秀的自主可控的AI軟件工具系統(tǒng)。像取代Wintel和ARM+Android系統(tǒng)一樣,就是要重構(gòu)軟件生態(tài)系統(tǒng),這是一項(xiàng)十分困難的任務(wù),需要周密的規(guī)劃和長(zhǎng)期努力。
信創(chuàng)工程對(duì)推廣國(guó)產(chǎn)化芯片和軟件有重大的推動(dòng)作用,但產(chǎn)業(yè)生態(tài)的形成主要靠市場(chǎng)牽引。國(guó)家要通過政策引導(dǎo),鼓勵(lì)在PC、手機(jī)和物端設(shè)備上推廣AI應(yīng)用,擴(kuò)大“國(guó)產(chǎn)大模型+國(guó)產(chǎn)GPU”應(yīng)用空間,增大國(guó)產(chǎn)GPU、CPU和軟件的市場(chǎng)份額。高度重視芯片設(shè)計(jì)和大模型的開源戰(zhàn)略,爭(zhēng)取我國(guó)在全球AI開源系統(tǒng)中起到主導(dǎo)作用。
GPU芯片可能在市場(chǎng)上延續(xù)相當(dāng)長(zhǎng)的時(shí)間。從長(zhǎng)遠(yuǎn)來看,GPU并非終極方案,針對(duì)一類AI應(yīng)用的專用芯片也可能成為主流。AI加速芯片將來可能進(jìn)入多芯片競(jìng)爭(zhēng)的XPU時(shí)代。Groq的LPU推理性能已達(dá)GPU的10倍,其單芯片能實(shí)現(xiàn)每秒250萬億次整數(shù)運(yùn)算,延遲低于1微秒。算力是AI基礎(chǔ)設(shè)施的重要組成部分,我們既要攻關(guān)ZFlops級(jí)的超算,也要探索類腦計(jì)算、光子計(jì)算等新范式。為了降低能耗,模擬計(jì)算、類腦計(jì)算、碳基計(jì)算等非傳統(tǒng)計(jì)算無疑是重要的研究方向。