被視為中國大陸神秘的AI公司、有「AI界拼多多」之稱的人工智慧初創企業「深度求索(DeepSeek)」近期刷屏全球各大主流媒體和社交網站,尤其造成美國AI科技圈極度震撼。該公司創辦人梁文鋒在大陸《央視》新聞聯播首次亮相時說,DeepSeek能震撼美國,是因為它來自中國大陸,而且AI要發展,必然需要有人站到技術的前沿。
據《快科技》報導,DeepSeek最新發佈的R1模型不僅在性能上比肩、甚至超越了OpenAI的o1,並完全開源,更以極低的成本實現了這一突破。
向來保持低調的DeepSeek老闆梁文鋒,日前首次亮相新聞聯播時表示,「在美國每天發生的大量創新裡,這是非常普通的一個。他們之所以驚訝,是因為這是一個中國大陸的公司,以創新貢獻者的身份,加入到他們遊戲裡去。」畢竟大部分的公司「習慣 follow,而不是創新。」
AI科技界有些人認為,DeepSeek可能會顛覆輝達(NVIDIA)在AI硬體領域的主導地位。在國外大模型排名Arena上,DeepSeek-R1基準測試已經升至全類別大模型第3,其中在風格控制類模型(StyleCtrl)分類中與OpenAI o1並列第1。
Arena放榜之後,全球關於DeepSeek的討論再次升級。
輝達的高級研究科學家范麟熙(Jim Fan)評價說:「我們生活在這樣一個時代:一家非美國公司正在讓OpenAI的初衷得以延續、真正開放、為所有人賦能的前沿研究。」
美國私募基金Noah's Arc Capital Management認為,DeepSeek-V3模型的突破顯著降低了AI培訓成本,使AMD GPU成為比NVIDIA更具有成本效益的替代品,增強了AMD的市場地位。
報導指出,DeepSeek-R1讓美國乃至全球的AI圈有如此大的反應,主要因為它突破了由美國和OpenAI建立起的規則。
以往由OpenAI引領的AI路線是以規模制勝,但這種發展模式也將AI發展帶入了一個怪圈,為追求更高的性能,大模型的體積只能不斷膨脹,參數數量呈現指數級增長,同時帶來了驚人的能源消耗和訓練成本。
但一家公司想發展AI,就必須投入高昂的成本向輝達買GPU晶片訓練,絕大多數公司根本難以為繼;而DeepSeek的誕生,讓低成本、高性能的AI成為可能。
大模型對算力投入的需求可能會從訓練側向推理側傾斜,即未來對推理算力的需求將成為主要驅動力。而輝達等硬體商的傳統優勢更多集中在訓練側,這可能會對其市場地位和戰略佈局產生影響。
美股大V「THE SHORT BEAR」在社交媒體上表示,DeepSeek創造了一個AI巨頭們的痛苦時刻,美國AI公司每年必須產生約6000億美元收入來支付其AI硬體費用,現在這種冒險行為變得越來越無利可圖,也因此造成輝達股價大跌。
梁文鋒表示,中國大陸的AI不可能永遠處在跟隨的位置,經常有人說中美的AI差距有1、2年,但真實的落差是原創和模仿之差。
梁文鋒認為,如果這個不改變,就永遠只能是追隨者,所以有些探索也是逃不掉的。輝達的領先,不只是一個公司的努力,而是整個西方技術社區和產業共同努力的結果。他們能看到下一代的技術趨勢,手裡有路線圖。中國大陸的AI發展,同樣需要這樣的生態,所以必然需要有人站到技術的前沿。