內地大模型有望超越GPT-4 Turbo

香港文匯報中國經濟 2024-01-31

　　香港文匯報訊（記者倪夢璟上海報道）大模型開源開放評測體系司南（OpenCompass2.0）昨日揭曉了年度大模型評測榜單，對過去一年來主流大模型進行全面評測診斷。分析結果顯示，OpenAI發布的GPT-4 Turbo在各項評測中均獲最佳表現，但在中文語境中，內地廠商近期發布的模型更有優勢，且在綜合測評中，來自內地的智譜清言GLM-4、阿里巴巴Qwen-Max、百度「文心一言」4.0緊隨GPT-4 Turbo，分別位列第二至第四名。在接受香港文匯報記者採訪時，上海人工智能實驗室領軍科學家林達華表示，內地大模型發展迅速，且對於中國使用者來說，中文大模型明顯更適合中國的語境，並預計今年內地大模型發展將超越現有OpenAI最先進的GPT-4 Turbo水平。

　　內地大模型中文語境優勢彰顯

　　此次，內地大模型智譜清言GLM-4、阿里Qwen-Max以及百度「文心一言」4.0都獲得不錯的成績。個體比較方面，目前「文心一言」相對語言能力方面更加有優勢，阿里Qwen-Max則更加擅長數學推理等。儘管總體而言，內地大模型綜合評分較低於OpenAI 發布的GPT-4 Turbo，但林達華直言內地大模型發展速度超乎想像，「不少國內廠商近期新發布的模型在多個能力維度上正在快速縮小與GPT-4 Turbo的差距，我們也期待隨着更多廠商的新模型發布，我們也相信，今年內，國內廠商的新模型就可以超越外國廠商如OpenAI目前的最強水平，尤其是部分模型，已經在中文場景實現了部分維度上對GPT-4 Turbo的超越。」

讀香港文匯報PDF版面