大陸AI新創公司DeepSeek以高CP值方式推出的AI模型,據傳能媲美OpenAI性能、甚至超越Meta的Llama,消息震驚矽谷和科技界,讓美股期貨在27日亞洲早盤重挫,日本晶片類股也聞訊大跌。

台北時間27日下午,標普500指數期貨下跌1.2%,那斯達克100指數期貨重挫2.2%。而日本半導體股也應聲暴跌,輝達的半導體測試設備供應商愛德萬測試(Advantest)盤中狂瀉逾8.5%,東京威力科創( Tokyo Electron Limited ) 大跌超過4%,Disco半導體下跌2.7%。
由大陸國產大模型公司杭州「深度求索」開發的DeepSeek R1,一問世可說是一夕爆紅,其人工智慧模板標榜低成本且高性能,採用開源模型,支援免費商用、任意修改及衍生開發等。
據《財聯社》等陸媒報導,DeepSeek-V3只用了2048塊H800 GPU,就完成6710億參數模型的訓練,訓練成本僅需557萬美元(約台幣1.8億元),遠低於GPT-4頂尖模型10億美元(約台幣326億元)的訓練費用。
這也讓外界質疑目前AI界研發投入的昂貴成本是否合理,甚至有人認為,DeepSeek可能威脅輝達等美國企業在AI領域的領先地位。

英國《金融時報》報導,DeepSeek的成功讓矽谷及科技界跌破眼鏡,因為其打破了「AI研發需仰賴龐大資金」的傳統觀念,證明透過精準的技術方案,也能取得傑出的研究成果。
更重要的是,DeepSeek團隊開放且分享創新技術,使其成為挑戰OpenAI、Google和Meta等美國企業巨頭的強勁對手。
陸媒《金融界》報導,1月27日,該應用更是登頂蘋果大陸地區和美國地區應用商店免費APP下載排行榜,在美區下載榜上超越了ChatGPT。
此前AMD還宣佈了,已將新的DeepSeek-V3模型集成到Instinct MI300X GPU上,該模型旨在與SGLang一起實現最佳性能。