
(大公報 記者 郭瀚林 北京報道)文心大模型兩周年之際,百度於16日正式發布文心大模型4.5和文心大模型X1。其中,文心大模型4.5是百度旗下首個原生多模態大模型,其多模態理解、文本和邏輯推理能力顯著提升,在多項測試中表現優於GPT4.5,API調用價格僅為GPT4.5的1%。文心大模型X1則為深度思考模型,性能對標DeepSeek-R1,調用價格約為R1的一半。
目前,兩款模型已在文心一言官網上線,百度搜索、文小言APP等產品也將陸續接入。此前,百度宣布文心一言將於4月1日免費,本次發布在帶來兩款全新大模型的同時,也將免費時間提前半個月。
文心4.5能理解文圖影音 「智商」「情商」兼備
與以往不同,百度今次未召開發布會,直接宣布兩款模型在文心一言官網上線。作為百度新一代基座大模型,文心大模型4.5的多項基準測試成績優於GPT4.5、DeepSeek-V3等,並在平均分上以79.6分高於GPT4.5的79.14。據介紹,文心大模型4.5具備優秀的多模態理解能力,能對文字、圖片、音頻、視頻等內容進行綜合理解。不僅有圖形推理、圖表分析的「高智商」,還具備理解網絡梗圖、諷刺漫畫等多模態內容的「高情商」。
用戶可給文心大模型4.5發送一張圖片或者一段視頻,讓其對製作工藝進行賞析。據用戶案例展示,文心4.5可識別出一張文物圖片中的唐三彩騎駝樂舞俑,並從造型生動、釉色鮮明、工藝精湛這三個方面對文物工藝進行詳細介紹和分析。此外,用戶還可給文心4.5發送一道數學題,讓其「在線解題」,文心4.5將綜合理解圖中的文字與圖表內容,提取出題目考查的重點,並給出詳細解題步驟和細化選項分析,最終得出正確答案。
文心大模型X1則為深度思考模型,不僅在性能上對標DeepSeek-R1,具備「長思維鏈」,擅長中文知識問答、文學創作、邏輯推理等,而且增加多模態能力和多工具調用,能理解和生成圖片,還能調用工具生成代碼、圖表等豐富內容。讓文心大模型X1使用中國各朝代歷史人物典故,替換《寒窰賦》原文中的事例,它會展現出清晰的思維鏈:找到和原文相似的人物典故→注意文風和句式→檢查人物典故的適配度→行文保持結構流暢,最後生成和原文立意、文風、句式都基本一致的文本。
X1像DeepSeek一樣展現思考過程
「與DeepSeek大模型類似,用戶提問後,文心X1在給出答案前會先展現思考過程。面對旅遊規劃、編寫課件等較複雜問題時,它能夠結合聯網搜索最新信息,詳細解讀後給出全面的回覆,更符合要求且可行性更高。」一位用戶試用文心大模型X1後說。據悉,X1已支持高級搜索、文檔問答、圖片理解、AI繪圖、代碼解釋器、網頁鏈接讀取、百度學術檢索、商業信息查詢、加盟信息查詢、詞雲生成等多款工具,這對於大模型應用落地是一個利好。
目前,兩款模型均已在文心一言官網上線,用戶登錄即可免費體驗。同時,企業及開發者可在百度智能雲千帆大模型平台調用新模型,文心大模型4.5已同步上線,輸入價格為0.004元/千tokens,輸出0.016元/千tokens,約為GPT4.5價格的1%;文心大模型X1也將於近期在該平台上線,定價為輸入0.002元/千tokens,輸出0.008元/千tokens,API調用價格約為DeepSeek推理模型R1的一半。
近期,內地AI大模型廠商紛紛宣布「迭代」,訓練和推理成本逐步下降,大模型開源大勢所趨。「從DeepSeek身上,我們學到了一件事,那就是開源最佳模型能大大促進人們使用或採納這個模型。」2月18日晚,在百度2024年第四季度及全年財報電話會上,百度創始人李彥宏如是說。
文心新成員
文心4.5
全能好手
主打:多模態(文字、圖片、音視頻),擅長理解和生成,比如聽歌識曲、看電影扒資訊。
價格:API調用價格僅為GPT4.5的1%
建議用途:適合生活娛樂
文心X1
思考能手
主打:推理和工具調用,兼備準確、創意和文采,能解複雜問題、生成PDF,回答有態度。
價格:調用價格為DeepSeek-R1的50%
建議用途:適合工作學習

面世兩周年 文心一言用戶超4億
百度於16日發布多模態大模型文心4.5和對標DeepSeek的文心X1,這一天同時也是文心一言初次亮相的兩周年。公開數據顯示,截至2024年11月,文心一言用戶規模為4.3億,文心大模型日均調用量超過15億次。百度創始人、董事長兼首席執行官李彥宏表示:「文心大模型日益增長的調用量,證明我們強大的人工智能能力正在獲得更廣泛的市場認可。」他同時表示,公司堅持以人工智能為核心的戰略,並對長期發展充滿信心。記者了解到,百度作為中國互聯網公司中最早發布大模型產品的大廠,近期在AI大模型方面動作頻頻。
2月13日上午,百度官方宣布,文心一言將於4月1日零時起全面免費,所有用戶均可體驗文心系列最新模型。次日,百度又宣布將在未來幾個月中陸續推出文心大模型4.5系列,並於6月30日起正式開源。2月18日,百度正式接入DeepSeek深度搜索功能。
據悉,百度還計劃在今年發布多款模型,並於今年下半年推出文心大模型5.0,在模型多模態能力方面有顯著增強。

與主流大模型對比
文心4.5
GPT-4o (OpenAI)
優勢:全球知名,英文場景強
比較:中文和多模態不如4.5
DeepSeek-V3-Chat
優勢:文本推理強,價格較低。
比較:多模態能力及應用範圍不如4.5
文心X1
GPT-4.5 (OpenAI)
優勢:速度快,生成流暢
比較:推理深度和工具應用不如 X1,價格貴
DeepSeek-R1
優勢:價格低,推理穩
比較:與X1相比工具調用少,靈活性略遜一籌
專家解讀|廣泛應用落地 實現商業價值
「以DeepSeek為先導,AI大模型技術突破驅動的訓練和推理成本下降,是今年以來國內外AI大模型迭代加速的底層原因。」信息安全專家、北京大學軟件工程國家工程中心博士潘克峰認為,「近期,DeepSeek、Manus等後起之秀接連在短時間快速滲透,說明了目前AI產品還沒有顯著的壁壘,哪個體驗更好用戶就轉向那個。在大模型領域,國際巨頭可能因為故步自封而落後,新興企業也能在自己擅長的賽道上實現彎道超車。」
潘克峰指出,從技術角度看,多模態能力是當前大模型發展的重要方向之一。「無論一個大模型如何優秀,它只有通過廣泛的應用落地,才能真正實現其商業價值和社會價值。」潘克峰認為,全球大模型產業發展的競爭態勢當前愈發激烈,而中國擁有全球最大的應用市場和全面的應用場景,因此無論是基礎模型的研發還是AI應用的規模化落地,都成為各家廠商布局的關鍵。「以百度為代表的國內大模型企業,正在這一波全球的技術發展浪潮中發揮自己的獨特優勢,並逐漸在這一競爭浪潮之中佔據先機。」
(來源:大公報A6:要聞 2025/03/17)

