內地人工智能知名專家張文宇接受香港文匯報專訪:開源換生態實現多場景運用 DeepSeek助中國AI換道超車

●浙江義烏國際商貿城的經營戶藉助DeepSeek、小商AI視創等工具,自動生成帶貨視頻吸引國內外訂單。中新社
●浙江義烏國際商貿城的經營戶藉助DeepSeek、小商AI視創等工具,自動生成帶貨視頻吸引國內外訂單。中新社

張文宇
張文宇

  2025年春節以來,DeepSeek持續霸榜熱搜,並火速應用到政務、民生、產業等社會各層面,為中國AI領域帶來了一場振奮人心的突破。「從2023年春節前ChatGPT的『狼來了』到2024年春節期間Sora引發的『多模態衝擊』,再到2025年春節前夕DeepSeek的崛起,中國AI的發展路徑正勾勒出一條獨特的『跟跑—並跑—局部領跑』曲線。」連續四年蟬聯全球前2%頂尖科學家榜單,浙江財經大學人工智能研究院院長張文宇近日在接受香港文匯報專訪時表示,這場競爭的本質並非簡單的技術追趕,而是一場覆蓋AI產業基礎層、技術層、應用層的系統性博弈。 ●香港文匯報記者 俞晝 杭州報道

  AI基礎層是整個AI產業鏈的基石,涵蓋數據、算力和算法三大核心要素。在張文宇看來,中國在此領域的現狀可以用「規模龐大但質量不足」概括,整體仍處於國際跟跑階段,但局部已顯現突破跡象。「早期,我們連領跑者的影子都看不到,伴隨着DeepSeek的橫空出世,終於發現我們已經『小荷初露尖尖角』。」

  「雖然中國擁有全球最大的數據資源池,數據『大而不強』的問題卻很突出,包括數據價值密度低、數據孤島林立、數據標註質量差等。」張文宇指出,DeepSeek的破局之道在於「四両撥千斤」——研發團隊通過把數據進行總結和分類,經過選擇性投餵與處理之後,輸送給大模型,提高了訓練效率。

  從算力層面來看,雖然中國算力規模龐大,但結構性問題顯著,包括高端芯片嚴重依賴進口、超算中心能耗過大、算力資源調度效率低等。「DeepSeek的算力突圍堪稱是『小米加步槍的勝利』。」張文宇頗為自豪地表示,面對美國芯片禁令,DeepSeek研發團隊對低配版GPU集群(甚至多源異構算力)進行智能管理,打破了「大力才能出奇跡」的算力魔咒。

  中國在算法基礎理論高度依賴海外

  同時,必須承認的是,中國在算法基礎理論領域仍高度依賴海外創新。「Transformer架構、MoE、Diffusion Model等核心框架均源自美國學術界,DeepSeek的實踐展現了它站在巨人肩膀上進行『二次創新』與『集成創新』的潛力,但坦率地說,這還遠遠稱不上是『從0到1』的顛覆性基礎理論突破,只能算是『從1到100』的工程創新。」

  AI技術層是連接基礎研究與商業應用的橋樑,主要包括計算機視覺、語音語義識別、機器學習、知識圖譜、AI大模型等技術。「在AI技術層,國內企業與學術界早已默默跟跑數年,但早期國產大模型的『稚嫩』表現——例如在此前的測試中,某國產大模型將『胸有成竹』誤解為『身上插滿竹子』,這讓公眾對中美技術差距的感知依然強烈。」不過,在張文宇看來,正是這種敢於「亮劍」的試錯精神,為後續的技術進階奠定了基礎。

  「當前,中國在AI技術層已進入與國際頂尖水平的『並跑』階段,尤其在模型工程化、多模態融合、推理效率等方面展現出獨特優勢。」張文宇指出,DeepSeek的崛起,更是展現了中國從「技術跟跑」到「技術並跑」過程中系統級協同創新的核心優勢。

  DeepSeek對數據算力算法協同創新及優化

  「回望2023年初,國產大模型像下水餃似地遍地開花,但普遍陷入『參數競賽』的誤區。」張文宇回憶道,智譜AI的GLM-130B、百度的ERNIE 3.0 Titan等模型參數量(是衡量AI大模型複雜度的核心指標,指的是大模型內部可調整的變量總數)均超千億,但實際表現與同時期的ChatGPT3.5相比還是存在1到2個技術代差。「DeepSeek的突破在於重新定義技術路線,並進行了基於群智協同(通過分布式群體智能協作實現技術突破)的系統級工程優化。」

  「DeepSeek不懼個別國家發起的『芯片禁令』和構築的『小院高牆』,在算力資源受限環境下另闢蹊徑,通過對人工智能三要素(數據、算力、算法)進行一系列的系統級協同創新與工程優化,並選擇向全世界開源,這無疑走出了與OpenAI等國外公司不同的技術路線,可謂是用一個『筋斗雲』實現了AI產業的『換道超車』,堪稱是一場AI技術革命。」

  AI應用層是AI在各領域的融合和應用,集成一類或多類AI技術,面向特定應用場景需求而形成的軟硬件產品或解決方案,主要包括在政府、金融、安防、智能家居、醫療、機器人、智能駕駛、新零售等領域的應用。「與基礎層、技術層的弱勢不同,中國在AI應用層擁有全球最多的產業門類與應用場景,形成了全球最活躍的AI商業化生態圈。」

  要用AI賦能戰略性新興產業與未來產業

  「以DeepSeek為例,它已向垂直行業滲透,實現從通用大模型到專用大模型的轉化。例如在金融領域,多家券商陸續官宣完成DeepSeek-R1模型的本地化部署;在醫療領域,多家醫療公司『牽手』DeepSeek,推動AI醫療加速落地;在通訊領域,中國移動、中國電信、中國聯通三家基礎電信企業均全面接入DeepSeek開源大模型,實現在多場景、多產品中的應用。」另一方面,作為開源大模型,DeepSeek鼓勵全球開發者在其基座模型上進行二次開發和創新。「從『賣API(Application Programming Interface,指應用程序編程接口,允許用戶對其調用後使用大模型的AI能力)』到『生態共建』,形成了一個活躍的生態系統,共同推動大模型技術的進步和應用的多樣化。」

  張文宇指出,通過開源換生態,DeepSeek吸引了大量的全球開發者參與生態建設,衍生出醫療、法律等成百上千個垂直版本。「發展新質生產力需要最大限度地激發產業與AI的乘數效應,而被乘數就是傳統產業、新興產業、未來產業及其產業鏈體系。」張文宇強調,我們不僅要用AI賦能傳統產業實現轉型升級,更要用AI賦能戰略性新興產業與未來產業。「不要沉溺於一個賽道的資本競爭,唯有通過另闢蹊徑的賽道轉換,中國企業才能獲得更多領跑世界的契機。」

  張文宇

  ●二級教授、博士生導師,浙江財經大學學術委員會副主任、人工智能研究院院長、盈陽金融科技學院院長。

  ●近年來主要研究領域包括:人工智能、智能製造、金融科技等。

  ●連續四年蟬聯2021~2024美國斯坦福大學全球前2%頂尖科學家榜單。