輝達剉勒等?DeepSeek R2大模型「傳下月問世」 恐再掀全球震撼

分享:

以低成本、高效能撼動全球人工智慧(AI)產業格局的大陸企業DeepSeek,最新傳出將以大模型DeepSeek R2強勢推出。市場最新爆料,R2大模型將採用更先進的混合專家模型(MoE),總參數量較前代R1提升約1倍,預計達1.2兆,單位推理成本較GPT-4大減97.4%。

以低成本、高效能撼動全球AI產業格局的大陸企業DeepSeek,最新傳出將以大模型DeepSeek R2即將強勢推出。(圖/美聯社)
以低成本、高效能撼動全球AI產業格局的大陸企業DeepSeek,最新傳出將以大模型DeepSeek R2即將強勢推出。(圖/美聯社)

時值美中科技戰延燒,美國AI晶片巨頭輝達(NVIDIA)的大陸「特供版」晶片H20面臨新一波出口管制,與此同時,DeepSeek R2預期發布時間臨近,各界高度關注大陸指標性大模型在缺乏美國晶片資源下的發展動向。

法人指出,DeepSeek R2將是觀察大陸AI技術進步的關鍵節點,該產品採用華為昇騰910C晶片,AI應用有望更加快速落地,邊緣運算包括手機及物聯網概念股包括聯發科、電源廠台達電、光寶及PA業者穩懋、宏捷科可望受惠。

DeepSeek R1於美東時間1月27日發布時,曾導致美國科技股大幅下跌,輝達單日市值蒸發近6,000億美元,NASDAQ下跌3.1%。法人指出,R2若如傳聞般強勢,可能再次引發市場對AI基礎設施需求的質疑,要提防對輝達等晶片廠的影響。

社群平台X玩家@deedydas於27日晚間爆料DeepSeek-R2最新參數,引發網友討論。據傳R2規模與ChatGPT的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相當,還將結合更智慧的門控網路層(Gating Network),進而優化高負載推理任務的性能。

消息指出,R2將徹底擺脫輝達晶片,訓練全程皆未使用輝達顯卡,全部基於昇騰910B(Ascend 910B)晶片集群平台,在FP16精度下,計算性能達到512 PetaFLOPS,晶片利用率高達82%,整體性能約為輝達上一代A100集群的91%。

市場預期,這有望降低大陸對海外高端AI晶片的依賴,且華為全新的昇騰910C晶片亦開始進入大規模量產階段,CloudMatrix 384超節點採用384顆昇騰910C晶片,或將成為輝達NVL72集群的替代方案。

成本方面,DeepSeek-R2的單位推理成本較美國企業OpenAI旗下的GPT-4大減97.4%。其中,R2輸入(input)每百萬個字元僅需0.07美元;而輸出(output)每百萬個字元僅0.27美元。(工商時報/楊晴安、李娟萍)

※本文授權自工商時報,原文:輝達剉著等?DeepSeek R2模型將問世 恐再掀陸製AI震撼 - 兩岸 - 工商時報 (ctee.com.tw) 美中貿易戰持續開打!陸抵制美貨改買爆「這國家」大豆- 兩岸 - 工商時報 (ctee.com.tw)
川普關稅戰最大苦主是「他們」印尼反坐享漁翁之利? - 兩岸 - 工商時報 (ctee.com.tw)

留言衝人氣 1則留言

登入留言有機會獲得旺幣哦!
NO MESSAGE 無任何留言,趕緊搶頭香!