tech 深度解析
DeepSeek V3 如何以 $5.6M 訓練成本挑戰百億美元系統
DeepSeek V3 以 671B 參數 MoE 架構、僅 278 萬 H800 GPU 小時的訓練成本,在多項基準測試上達到接近 GPT-4 的表現,API 費用僅是 OpenAI 的十分之一。
Tag
1 篇文章
DeepSeek V3 以 671B 參數 MoE 架構、僅 278 萬 H800 GPU 小時的訓練成本,在多項基準測試上達到接近 GPT-4 的表現,API 費用僅是 OpenAI 的十分之一。