新聞

DeepSeek V3-0324 更新版本，推理能力和中文寫作大幅提升

· 2025年3月26日

深度求索（DeepSeek）近日在Hugging Face平台上發布了DeepSeek-V3-0324新版模型，作為DeepSeek-V3的優化更新版本，在多個關鍵能力上取得了顯著提升，特別是在推理能力、前端網頁開發和中文寫作表現方面有明顯進步。

推理能力大幅提升

在基準測試方面，DeepSeek-V3-0324相較於前代產品取得了亮眼的成績提升：

MMLU-Pro測試：從75.9提升至81.2（+5.3）
GPQA科學問答：從59.1提升至68.4（+9.3）
AIME數學：從39.6大幅跳升至59.4（+19.8）
LiveCodeBench代碼基準：從39.2提升至49.2（+10.0）

其中，特別值得關注的是在AIME數學測試中近20點的巨大進步，顯示該模型在處理數學推理任務上有了質的飛躍。

前端網頁開發能力增強

新版模型在網頁開發方面也有顯著改進：

提高了代碼的可執行性
產生更具美觀性的網頁和遊戲前端界面

中文寫作能力優化

DeepSeek-V3-0324在中文寫作上優化明顯：

與R1寫作風格更加一致
中長篇寫作品質提升
增強了多輪互動重寫能力
優化翻譯質量和書信寫作表現

中文搜索與功能調用改進

除了核心能力提升外，新版本還特別針對以下功能進行了優化：

強化報告分析請求，能夠輸出更詳細的內容
提高Function Calling（功能調用）的準確性，修復了之前V3版本的問題

TechApple觀點：中國開源大模型的崛起與差距縮小

DeepSeek-V3-0324的發布代表了中國開源大模型陣營的重要進展。從數據上看，特別是在AIME數學測試上近20點的提升，以及GPQA科學問答上的大幅進步，顯示DeepSeek在處理高難度推理任務上已經取得了實質性突破。值得注意的是，DeepSeek特別強調了中文能力的提升，這反映了中國AI公司對本土市場的重視，也是與西方模型的差異化競爭策略。尤其在報告分析和長文寫作方面的改進，更貼合中國企業和個人用戶的實際需求。

然而，開源模型的發展面臨雙面挑戰：一方面需要不斷提升技術實力，另一方面又要平衡開源與商業化的矛盾。DeepSeek採取MIT許可證方式開源，顯示了其開放的態度，但如何在保持技術透明的同時建立可持續的商業模式，仍是所有開源AI公司需要思考的問題。

參考內容：https://huggingface.co/deepseek-ai/DeepSeek-V3-0324?utm_source=ai.briefnewsletter.com&utm_medium=newsletter&utm_campaign=deepseek&_bhlid=32624859d68cb9ea6e13fce6cb0d5ac0a83e058d

最新電競現場活動記事

You may also like...