DeepSeek春節再震撼全球?陸媒:官方曝正測試新模型結構

分享:

大陸AI新創公司深度求索(DeepSeek) 2025年推出R1模型,受到來自全球的高度矚目。官方證實,目前正在測試新的長文本模型結構,這意味著DeepSeek可能在今年春節期間發布新一代模型重現去年引發的現象級轟動。

AI新創公司DeepSeek。(圖/路透社)
AI新創公司DeepSeek。(圖/路透社)

根據陸媒《澎湃新聞》,2月13日,DeepSeek網頁與App(應用程式)正在測試新的長文本模型結構,支持1M上下文。其API服務不變,仍為V3.2,僅支持128K上下文。

此前在1月,DeepSeek與北京大學共同發表新論文《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models》(基於可擴展查找的條件記憶:大語言模型稀疏性的新維度),作者名單包含DeepSeek創辦人梁文鋒。

該論文核心針對大語言模型記憶力問題,提出「條件記憶」概念,當時業界即推測DeepSeek下一代旗艦大模型V4將在春節前後正式亮相。

去年12月,DeepSeek推出2款正式版模型:DeepSeek-V3.2與DeepSeek-V3.2-Speciale。官方網頁端、App及API(應用程式介面)全面更新為正式版DeepSeek-V3.2,而Speciale版目前僅以臨時API服務形式開放,供社區評測與研究使用。

官方介紹指,DeepSeek-V3.2設計目標是平衡推理能力與輸出長度,適用於日常問答場景及通用Agent(智能體)任務場景。

另外,在公開推理類Benchmark測試中,DeepSeek-V3.2表現達到GPT-5水準,僅略低於Gemini-3.0-Pro。

DeepSeek作為大陸的AI大模型風向標,每個動向都受到業界高度關注。「deepseek」一詞成功以超過867萬的搜尋量,當選大陸網易有道詞典的2025年度詞彙。

留言衝人氣 4則留言

登入留言有機會獲得旺幣哦!
NO MESSAGE 無任何留言,趕緊搶頭香!