完成人民幣500億元融資後,大陸AI模型開發商DeepSeek可謂動作頻頻,不僅大舉擴招團隊規模,更在近日為旗下最新V4模型更新版本,據稱可將該模型推理速度最高提升85%,同時大幅降低了部署成本。
綜合陸媒報導,DeepSeek在6月27日更新了V4模型,推出推測解碼(Speculative Decoding)框架DSpark,並開源了全棧工具DeepSpec。
DeepSeek-V4-Pro-DSpark並非全新架構模型,而是在DeepSeek-V4-Pro的基礎上引入了推測解碼模組。因此,此次更新的重點在於工程應用,而非模型能力本身的反覆運算。
推測解碼是一種在不影響模型輸出結果的前提下,有效提升推理效率的技術。該技術先由羽量級模型預先生成候選內容,再交由主模型進行驗證,從而加快大型語言模型(LLM)的推理速度。
DeepSpec則是用於訓練與評估推測解碼草稿模型(Draft Model)的完整開源工具,包含資料準備、模型訓練、草稿模型實現及性能評估等功能。這可協助研究人員直接訓練推測解碼模型,大幅降低部署門檻。
根據DeepSeek創始人梁文鋒與北京大學共同發表的論文,將DSpark部署在DeepSeek-V4線上服務系統中並在真實使用者流量環境下運行,可有效減少因無效驗證而造成的算力浪費。
相較於既有的生產環境基準方案,DSpark在相同輸送量下,可將單一使用者的生成速度提升60%至85%。
據OpenRouter的資料顯示,在大陸更加低廉的大模型Token定價衝擊下,截至今年6月,向谷歌、OpenAI和Anthropic模型發出的Token請求份額,已從一年前的72%大幅降至33%;而截至3月,大陸AI模型的市占率已攀升至60%以上。(文/工商時報張全慶)
※本文授權自工商時報,原文:見此
【更多工商時報報導】