科技

韓國 AI 自主夢驚爆「抄襲」風波，國產模型大賽五強入圍三家被揭用中國開源碼

編輯部 2天前 9 瀏覽

韓國政府去年 6 月大搞「國產 AI 模型大賽」，目標 3 年內打造「純韓技術」大型 AI 模型，力求追到 OpenAI、Google 水準九成五表現。不成想計劃中途就爆出一場「抄襲」風波，五間決賽公司中，竟有三間被指使用中國及美國開源程式碼，瞬間引發「主權 AI」公信力危機。

該場比賽由科學部主辦，勝出者可獲政府數據、人才及 AI 晶片資源，旨在降低對中美科技依賴。不過，理想豐滿現實卻骨感，面對當今全球 AI 兩極化生態，南韓「從零開始」的願景無疑要面對嚴峻考驗。

風波核心就係初創公司 Upstage，競爭對手 Sionic AI CEO 高錫賢於 LinkedIn 公開發文，指 Upstage 參加國家項目的基礎模型 Solar Open 100B 與中國智譜 AI 的 GLM 4.5 Air 模型有 96.8% 相似度，而且還有版權標記殘留。高暗示對方只是「微調中國模型再包裝」，用納稅人錢交「偽國產作業」。

Upstage 即開直播驗證會，展示訓練日誌證明核心模型從空白開始訓練，只在推理框架採用全球常見的智譜開源組件。CEO 金聖勳解釋，LayerNorm 數值之所以會高度相似，是因為大型語言模型如果使用相近 Transformer 或 MoE 架構，再以類似數據訓練，最終統計特徵便有很大可能會收斂到近似結果。公開驗證之後一日，高錫賢便公開道歉，承認未充分驗證即炮轟做法欠妥。

Upstage 被點名之後，其他決賽隊伍都被放大鏡檢視。Naver 旗下視覺同音訊編碼器被指同阿里巴巴「通義千問」設計相似，SK Telecom 所用推理程式碼也疑似「撞車」DeepSeek。兩間公司都承認有用到開源模組，但強調核心訓練引擎全自主開發，外部組件只作標準化處理，屬行業常見做法。首爾大學 AI 研究院院長李在儒亦公開表示，被質疑的幾個模型「的確從零開始訓練」，並無直接復制外國模型權重。

究竟自主 AI 是否一定要完全自寫每行代碼？學術界意見兩極。哈佛大學教授韋巨賢表示：「要求每行程式碼都自己寫根本不現實，放棄開源軟體，等於將大堆好處丟到海裡。」

但反對派就擔心，就算只用外圍代碼，都可能引入後門或者供應鏈依賴風險，「主權 AI」戰略意義會被削弱。現在最尷尬就是競賽規則根本沒講清楚外國開源碼是否可用，科學部至今未出新指引。部長裴慶勳僅表示自己樂見技術辯論，稱「見到韓國 AI 的光明未來」。

有評論形容，Upstage 事件是南韓 AI 生態系統第一次「壓力測試」：一方面暴露競賽規則對開源使用的灰色地帶，另一方面亦倒逼政府、初創同學界明確獨立模型的真正定義。

緊貼最新科技資訊、網購優惠，追隨 Yahoo Tech 各大社交平台！

🎉📱 Tech Facebook：https://www.facebook.com/yahootechhk

🎉📱 Tech Instagram：https://www.instagram.com/yahootechhk/

🎉📱 Tech WhatsApp 社群：https://chat.whatsapp.com/Dg3fiiyYf3yG2mgts4Mii8

🎉📱 Tech WhatsApp 頻道：https://whatsapp.com/channel/0029Va91dmR545urVCpQwq2D

🎉📱 Tech Telegram 頻道：https://t.me/yahootechhk

新聞來源: 原始來源

分享本文

韓國 AI 自主夢驚爆「抄襲」風波，國產模型大賽五強入圍三家被揭用中國開源碼

讀者評論 (0)

請登入後發表評論