春節期間,深度求索(DeepSeek)在美國地區蘋果App Store下載榜上超越ChatGPT的消息傳出,震撼科技產業、也引發市場劇烈震盪。台灣雲象科技CEO葉肇元憂心地說,他關注的不是到底DeepSeek有沒有比其他美國科技公司的模型強,結果是否可信可複製,他在想的是,台灣在AI至為關鍵的未來中,如何定位自己?
雲象科技專注在醫療影像的AI上,葉肇元說,他當然不敢自稱自己懂大型語言模型,但在AI軟體這個行業裡,他不得不關注台灣AI行業的未來,我也關注未來台灣是否能在AI這個領域裡佔有一席之地,因為這是一個注定在短期之內顛覆人類發展進程的一個破壞性的技術。
從最根本的問題開始,在我們評論別人的大型語言模型之前,我們先看看台灣有哪些大型語言模型研究計畫? 葉肇元說,他找了半天大概只找到三個;
1. TAIDE (推動台灣可信任生成式AI發展計畫) (TAIDE - 推動台灣可信任生成式AI發展計畫) : 這是由國科會提供約三億元經費所補助發展的計劃,在Github (https://github.com/taide-taiwan)上面看不到程式碼,在Huggingface (https://huggingface.co/taide)上面可以下載得到模型,但上一次更新停在2024年五月。這個計畫中花了一億元左右買了72個H100的GPU(計算力約3 PFLOPS)。
2. TAME(TAiwan Mixture of Experts)由長春集團、和碩聯合科技、長庚醫院、欣興電子、科技報橘聯聯合發起的一個大型語言模型開發計畫,由台大資工系的陳醞儂教授以及她指導的博士班學生林彥廷主導開發。最新的模型發表是2024年6月(https://github.com/MiuLab/Taiwan-LLM,https://huggingface.co/yen....../Llama-3-Taiwan-70B-Instruct),知識終止於2021年9月(我問他知識有多久沒有更新了,這是他給我的回答)。
3. 聯發科的DaVinci 生成式AI平台(https://prod.dvcbot.net/login): 計畫經費不詳,但這反而是持續有在更新的。但這個平台到底可以做甚麼,他無法得知,因為網站有受到帳號密碼控管,而且無法申請新的帳號。
葉肇元表日前(31日)透過臉書,跟國人分享上述他得知的技術並表示,他不做技術評論,只從執行計畫的常識來判斷。上述這些計畫看得出來都是在ChatGPT正火熱的當下拿到短暫的經費去做的,然後後續不知道該怎麼辦,因為無法明確地講出效益,無法爭取得到更多經費支持,於是模型就沒有更新了。也因此這些計畫的實質效益都非常有限。這不能怪這些研究團隊,這是台灣科技發展的結構性問題。他認為,現在應該是需要重新再次檢討的時刻了。「AI的發展如此的快速,我們必須要承認,到目前為止,我們的AI發展策略並不是很有效。」
葉肇元說,他自己如果需要AI幫忙,絕大多數的時間都還是在使用ChatGPT或是Gemini。台灣的這些計畫,為了跟風,缺乏長期規劃,只是一頭熱的經費投入,只是造就了一些新聞,並沒有太多的實質效益。「結果現在我們講AI只講得出,算力即國力,但我就想問一句,算力要拿來算什麼? 」再者,其實台灣現在能給學界業界拿來做AI研發的超級電腦已經是垂垂老矣,建置於2018年的台灣杉二號,計算力是9 PFLOPS。在台灣國土內目前算力最強的超級電腦,Taipei-1,是由NVIDIA所建置的,供他們內部研發用途,因為有受到經濟部補助的關係,有限度地開放給學界業界使用,但必須提出計畫申請,被核可之後才可以使用,使用也是有限時的,所以這並不能真的算得上是能幫助台灣AI研發的計算資源。
葉肇元表示,其實他做了這些功課之後,並沒有任何答案,只有問題。台灣的AI戰略計畫是甚麼? 生成式AI這麼重要的,對於人類的生產力有大幅影響甚至是對於國家安全有重大影響的技術,「我們除了代工生產硬體之外,預計如何應對?」
「這是個不好解的題,但它是台灣非解不可的題。」葉肇元強調,在大方向上,他可以肯定的是,政府必須要有長期 (至少十年) 且具有一貫性的計畫,精準地選擇就台灣所可以支配的資源限制下,和國家發展相契合的軟體技術發展方向來深耕,並且和相關的企業密切的配合建構出足以成長茁壯的產業生態系,由商業發展的前景來持續支持尖端AI技術的長期發展。