憑藉低成本模式震驚世界的大陸人工智慧新創公司DeepSeek,今(24日)推出新一代大型語言模型V4預覽版,為針對華為晶片技術進行適配的新模型,引發市場高度關注。
捨輝達轉向華為昇騰晶片
《路透社》報導,DeepSeek過去主要依賴輝達晶片訓練模型,但此次V4版本明顯轉向與華為合作。不過,DeepSeek並未公開說明訓練V4所使用的具體處理器型號。
DeepSeek表示,V4 Pro版本在世界知識基準測試中,已超越多數開源模型,僅落後於Google旗下封閉源模型Gemini-Pro-3.1。新版本同時推出成本更低的Flash版本,作為正式產品發布前的預覽版本,用於蒐集市場回饋與進一步優化。另一方面,華為表示,旗下昇騰(Ascend)AI晶片產品線已全面支援DeepSeek V4模型。
報導指出,然而,就在DeepSeek曝光新模型前一天,白宮公開指控中國大陸「大規模竊取美國AI實驗室智慧財產權」,並點名陸企涉嫌規避美國出口管制,取得高階AI晶片。大陸駐美大使館回應,中方反對「毫無根據的指控」,並強調北京高度重視智慧財產權保護。