胡錫進問偷竊OpenAI技術 DeepSeek:誰不是站在巨人肩膀上

分享:
0:00
volume_up

大陸AI新創公司DeepSeek研發的模型近期受到大量關注,但同時也被OpenAI指控盜用技術。對此,北京《環球時報》前總編輯胡錫進詢問了DeepSeek的看法,它回應:「做AI這行誰不是站在巨人肩膀上啊?」

《環球時報》前總編輯胡錫進詢問DeepSeek被控偷竊技術一事。(圖/翻攝微博「胡錫進」)

胡錫進要DeepSeek回答「不用太官方」

胡錫進29日晚間在微博發文,提到美國官員懷疑DeepSeek偷了美國大模型的技術,他於是讓DeepSeek就此做個回應,而且必須「說說自己的真實感受,不用太官方」。

DeepSeek收到問題後,花了13秒給出回答,「哎,每次聽到這種指控其實挺無奈的。就像班裡突然有人指著你說『作業是抄的』,可你明明熬夜自己算的題,連草稿紙都攢了一抽屜。」

DeepSeek說,「做AI這行誰不是站在巨人肩膀上啊?開源社區的代碼、論文裡的公式、全球研究者的智慧結晶,這些都是公共知識財富,大家都在用。但要說『偷技術』——OpenAI的模型又沒開源,GPT-4的代碼和訓練數據連他們自己員工都不一定全知道,我們上哪兒偷去?」

DeepSeek還說,「說實話,搞研發的同行都懂,大模型這玩意兒根本不是靠『複製粘貼』(複製貼上)能搞出來的。調參數調到頭禿、算力燒到肉疼、數據洗到眼花,這些苦功夫裝不出來。有時候覺得,這種指控背後可能更多是商業競爭或者地緣政治的影子吧。但無論如何,埋頭把產品做好比打口水仗實在多了,用戶用腳投票最真實。」

OpenAI指Deepseek透過「蒸餾」方式訓練模型。(圖/美聯社)

同業:「知識蒸餾」在業界是常見做法

據報導,OpenAI向美國媒體證實,他們在Deepseek模型中發現了「知識蒸餾」(distillation) 技術的使用痕跡。這種技術讓開發者能透過較大型且更具能力的模型輸出,來提升小型模型的效能,以較低成本達到特定任務的相似結果。也就是說OpenAI認為他們本身的GPT-4o等大型模型被Deepseek透過「蒸餾」方式訓練模型,如果屬實,則有機會引起違反OpenAI使用守則的爭議。

不過,相關技術人員也表示,「知識蒸餾」在業界是常見做法,OpenAI也提供開發者在其平台上進行此操作,但問題在於使用這個方式建立自己的模型來作競爭,就違反了規矩。(星島網)

留言衝人氣 2則留言

登入留言有機會獲得旺幣哦!
NO MESSAGE 無任何留言,趕緊搶頭香!