大陸AI領域領頭羊「深度求索」(DeepSeek)即將推出新一代旗艦模型「V4」,市場最新消息指出,該模型將打破業界長期依賴輝達的慣例,改採華為最新設計的國產晶片運作。此舉不僅顯示大陸在算力自主化方面邁出重要一步,更引發阿里巴巴、字節跳動及騰訊等科技巨頭的連鎖反應,紛紛下單訂購數十萬枚華為新晶片。
攜手華為與寒武紀優化代碼 DeepSeek-V4 傳本月發布
根據《路透社》引述美國科技媒體《The Information》的報導指出,DeepSeek正在研發的V4模型預計將在未來幾週內正式亮相。消息人士透露,為了確保模型與國產硬體高度契合,DeepSeek研發團隊過去數月來與華為及另一家大陸晶片研發商「寒武紀科技」緊密合作,重新編寫部分底層代碼並進行密集的壓力測試,以確保在國產算力平台上的運行效能達到最佳化。
此外,DeepSeek此次並未遵循業界慣例將新模型送交美國晶片商進行性能優化,而是選擇將早期測試權限開放給華為等國內供應商。據了解,V4屆時將推出三種針對不同功能優化的變體版本,所有版本均以國產晶片架構為基礎開發,目標是建立從軟體到硬體完全自主可控的技術鏈結。
事實上,DeepSeek先前推出低成本模型V3與R1時,曾因其高效能與低預算的特點引發全球科技股震盪,促使投資人重新思考美系AI企業投入數十億美元購買算力設備的必要性。如今V4選擇走一條「去美化」的路線,其性能表現是否能延續前代的震撼力,已成為全球科技產業與資本市場高度關注的焦點。
儘管市場預期V4有望成為最強大的開源模型之一,但也有觀察家提醒,大陸目前的先進製程技術大致維持在5奈米水準,與全球頂尖技術仍有落差。在實際的大模型運算環境下,華為晶片的穩定性與效能是否能與輝達抗衡,仍有待V4正式發布後,經由實際應用場景進一步驗證。
此前,有大陸媒體曾傳V4將在4月發布,並稱它很大機率仍是開源最強模型,「但很難是碾壓級的強」。