產業 >科技產業
DeepSeek-R1論文登國際期刊《自然》封面,揭訓練29萬美元成本優勢
2025/9/18 12:38

【財訊快報/陳孟朔】中國AI企業DeepSeek(深度求索)再傳捷報。由梁文鋒擔任通訊作者的DeepSeek-R1推理模型研究論文,登上國際權威期刊《自然》(Nature)封面,成為全球首個通過同行評議的主流大語言模型,標誌中國在基礎研究領域取得重要突破。
與今年1月的未經評審初版相比,新版DeepSeek-R1論文在審稿過程中,根據專家意見刪減過度擬人化的描述,補充模型訓練資料類型、安全性考量及技術細節,並正面回應外界對知識蒸餾的質疑。團隊明確否認有意利用OpenAI模型輸出進行訓練,強調DeepSeek-V3 Base基座模型完全以互聯網數據為來源,雖然不排除包含GPT-4產生的內容,但絕非刻意蒸餾。
DeepSeek開源後,R1模型在Hugging Face平台下載量突破1,090萬次,成為全球最受歡迎的開源推理模型。值得注意的是,該團隊首次公開訓練成本僅29.4萬美元,即便加上約600萬美元的基座模型成本,整體仍遠低於OpenAI與Google的AI訓練開支。
《自然》評論指出,隨AI快速普及,大模型企業難以驗證的宣傳帶來真實風險,而依靠獨立研究人員的同行評議,有助抑制產業過度炒作。DeepSeek的成果不僅提升國際學術影響力,也為AI產業建立新的透明標準提供了可參考的範例。
市場解讀,此次論文登頂《自然》,有望提振中國AI產業鏈信心,相關算力、半導體與雲端服務供應商股價或受資金關注,推動整體AI概念股表現。
相關新聞