融資500億後大動作!DeepSeek最新模型速度飆85%

分享:

完成人民幣500億元融資後,大陸AI模型開發商DeepSeek可謂動作頻頻,不僅大舉擴招團隊規模,更在近日為旗下最新V4模型更新版本,據稱可將該模型推理速度最高提升85%,同時大幅降低了部署成本。

示意圖:DeepSeek。(資料照/路透社)
示意圖:DeepSeek。(資料照/路透社)

綜合陸媒報導,DeepSeek在6月27日更新了V4模型,推出推測解碼(Speculative Decoding)框架DSpark,並開源了全棧工具DeepSpec。

DeepSeek-V4-Pro-DSpark並非全新架構模型,而是在DeepSeek-V4-Pro的基礎上引入了推測解碼模組。因此,此次更新的重點在於工程應用,而非模型能力本身的反覆運算。

推測解碼是一種在不影響模型輸出結果的前提下,有效提升推理效率的技術。該技術先由羽量級模型預先生成候選內容,再交由主模型進行驗證,從而加快大型語言模型(LLM)的推理速度。

DeepSpec則是用於訓練與評估推測解碼草稿模型(Draft Model)的完整開源工具,包含資料準備、模型訓練、草稿模型實現及性能評估等功能。這可協助研究人員直接訓練推測解碼模型,大幅降低部署門檻。

根據DeepSeek創始人梁文鋒與北京大學共同發表的論文,將DSpark部署在DeepSeek-V4線上服務系統中並在真實使用者流量環境下運行,可有效減少因無效驗證而造成的算力浪費。

相較於既有的生產環境基準方案,DSpark在相同輸送量下,可將單一使用者的生成速度提升60%至85%。

據OpenRouter的資料顯示,在大陸更加低廉的大模型Token定價衝擊下,截至今年6月,向谷歌、OpenAI和Anthropic模型發出的Token請求份額,已從一年前的72%大幅降至33%;而截至3月,大陸AI模型的市占率已攀升至60%以上。(文/工商時報張全慶)

※本文授權自工商時報,原文:見此

【更多工商時報報導】

成年子女在經濟上依賴父母怎麼辦?專家建議兩步驟財務斷奶計畫

台股震盪失守月線 本周拚重新站回

高雄市30日標售小港和高大兩筆千坪土地 將成後市重要指標

留言衝人氣

登入留言有機會獲得旺幣哦!
NO MESSAGE 無任何留言,趕緊搶頭香!