科技
韓國 AI 自主夢驚爆「抄襲」風波,國產模型大賽五強入圍三家被揭用中國開源碼
韓國政府去年 6 月大搞「國產 AI 模型大賽」,目標 3 年內打造「純韓技術」大型 AI 模型,力求追到 OpenAI、Google 水準九成五表現。不成想計劃中途就爆出一場「抄襲」風波,五間決賽公司中,竟有三間被指使用中國及美國開源程式碼,瞬間引發「主權 AI」公信力危機。
該場比賽由科學部主辦,勝出者可獲政府數據、人才及 AI 晶片資源,旨在降低對中美科技依賴。不過,理想豐滿現實卻骨感,面對當今全球 AI 兩極化生態,南韓「從零開始」的願景無疑要面對嚴峻考驗。
風波核心就係初創公司 Upstage,競爭對手 Sionic AI CEO 高錫賢於 LinkedIn 公開發文,指 Upstage 參加國家項目的基礎模型 Solar Open 100B 與中國智譜 AI 的 GLM 4.5 Air 模型有 96.8% 相似度,而且還有版權標記殘留。高暗示對方只是「微調中國模型再包裝」,用納稅人錢交「偽國產作業」。
Upstage 即開直播驗證會,展示訓練日誌證明核心模型從空白開始訓練,只在推理框架採用全球常見的智譜開源組件。CEO 金聖勳解釋,LayerNorm 數值之所以會高度相似,是因為大型語言模型如果使用相近 Transformer 或 MoE 架構,再以類似數據訓練,最終統計特徵便有很大可能會收斂到近似結果。公開驗證之後一日,高錫賢便公開道歉,承認未充分驗證即炮轟做法欠妥。
Upstage 被點名之後,其他決賽隊伍都被放大鏡檢視。Naver 旗下視覺同音訊編碼器被指同阿里巴巴「通義千問」設計相似,SK Telecom 所用推理程式碼也疑似「撞車」DeepSeek。兩間公司都承認有用到開源模組,但強調核心訓練引擎全自主開發,外部組件只作標準化處理,屬行業常見做法。首爾大學 AI 研究院院長李在儒亦公開表示,被質疑的幾個模型「的確從零開始訓練」,並無直接復制外國模型權重。
究竟自主 AI 是否一定要完全自寫每行代碼?學術界意見兩極。哈佛大學教授韋巨賢表示:「要求每行程式碼都自己寫根本不現實,放棄開源軟體,等於將大堆好處丟到海裡。」
但反對派就擔心,就算只用外圍代碼,都可能引入後門或者供應鏈依賴風險,「主權 AI」戰略意義會被削弱。現在最尷尬就是競賽規則根本沒講清楚外國開源碼是否可用,科學部至今未出新指引。部長裴慶勳僅表示自己樂見技術辯論,稱「見到韓國 AI 的光明未來」。
有評論形容,Upstage 事件是南韓 AI 生態系統第一次「壓力測試」:一方面暴露競賽規則對開源使用的灰色地帶,另一方面亦倒逼政府、初創同學界明確獨立模型的真正定義。
緊貼最新科技資訊、網購優惠,追隨 Yahoo Tech 各大社交平台!
🎉📱 Tech Facebook:https://www.facebook.com/yahootechhk
🎉📱 Tech Instagram:https://www.instagram.com/yahootechhk/
🎉📱 Tech WhatsApp 社群:https://chat.whatsapp.com/Dg3fiiyYf3yG2mgts4Mii8
🎉📱 Tech WhatsApp 頻道:https://whatsapp.com/channel/0029Va91dmR545urVCpQwq2D
🎉📱 Tech Telegram 頻道:https://t.me/yahootechhk
該場比賽由科學部主辦,勝出者可獲政府數據、人才及 AI 晶片資源,旨在降低對中美科技依賴。不過,理想豐滿現實卻骨感,面對當今全球 AI 兩極化生態,南韓「從零開始」的願景無疑要面對嚴峻考驗。
風波核心就係初創公司 Upstage,競爭對手 Sionic AI CEO 高錫賢於 LinkedIn 公開發文,指 Upstage 參加國家項目的基礎模型 Solar Open 100B 與中國智譜 AI 的 GLM 4.5 Air 模型有 96.8% 相似度,而且還有版權標記殘留。高暗示對方只是「微調中國模型再包裝」,用納稅人錢交「偽國產作業」。
Upstage 即開直播驗證會,展示訓練日誌證明核心模型從空白開始訓練,只在推理框架採用全球常見的智譜開源組件。CEO 金聖勳解釋,LayerNorm 數值之所以會高度相似,是因為大型語言模型如果使用相近 Transformer 或 MoE 架構,再以類似數據訓練,最終統計特徵便有很大可能會收斂到近似結果。公開驗證之後一日,高錫賢便公開道歉,承認未充分驗證即炮轟做法欠妥。
Upstage 被點名之後,其他決賽隊伍都被放大鏡檢視。Naver 旗下視覺同音訊編碼器被指同阿里巴巴「通義千問」設計相似,SK Telecom 所用推理程式碼也疑似「撞車」DeepSeek。兩間公司都承認有用到開源模組,但強調核心訓練引擎全自主開發,外部組件只作標準化處理,屬行業常見做法。首爾大學 AI 研究院院長李在儒亦公開表示,被質疑的幾個模型「的確從零開始訓練」,並無直接復制外國模型權重。
究竟自主 AI 是否一定要完全自寫每行代碼?學術界意見兩極。哈佛大學教授韋巨賢表示:「要求每行程式碼都自己寫根本不現實,放棄開源軟體,等於將大堆好處丟到海裡。」
但反對派就擔心,就算只用外圍代碼,都可能引入後門或者供應鏈依賴風險,「主權 AI」戰略意義會被削弱。現在最尷尬就是競賽規則根本沒講清楚外國開源碼是否可用,科學部至今未出新指引。部長裴慶勳僅表示自己樂見技術辯論,稱「見到韓國 AI 的光明未來」。
有評論形容,Upstage 事件是南韓 AI 生態系統第一次「壓力測試」:一方面暴露競賽規則對開源使用的灰色地帶,另一方面亦倒逼政府、初創同學界明確獨立模型的真正定義。
緊貼最新科技資訊、網購優惠,追隨 Yahoo Tech 各大社交平台!
🎉📱 Tech Facebook:https://www.facebook.com/yahootechhk
🎉📱 Tech Instagram:https://www.instagram.com/yahootechhk/
🎉📱 Tech WhatsApp 社群:https://chat.whatsapp.com/Dg3fiiyYf3yG2mgts4Mii8
🎉📱 Tech WhatsApp 頻道:https://whatsapp.com/channel/0029Va91dmR545urVCpQwq2D
🎉📱 Tech Telegram 頻道:https://t.me/yahootechhk
新聞來源: 原始來源
尚無評論,成為第一個發言的人吧!