台灣主權AI的掙扎與突破:算力投資以外的關鍵戰場
台灣推動主權AI的藍圖,近期遭到來自產官學界的多方檢視。立法院質詢揭露,政府今年二月釋出的TAIDE模型在查詢現任立委名單時竟生成錯誤人名;更根本的問題在於,台灣AI對本土語境與文化符號的掌握仍遠遠不足,主權AI的成敗不僅取決於算力,更取決於資料與人才。
在全球AI競爭的版圖上,台灣有著獨特的矛盾處境:我們擁有全球第六大企業台積電、在AI伺服器供應鏈中舉足輕重,卻在大型語言模型的發展上遠遠落後於美中兩強。行政院積極推動「AI新十大建設」方案,計畫打造主權AI,其中一項任務是將國研院國網中心的算力擴大至23MW——然而,算力的投資只是開始,真正的難關在後頭。
TAIDE失誤暴露的深層問題
立法院質詢揭露,政府今年二月釋出的TAIDE(Trustworthy AI Dialogue Engine,台灣對話引擎)模型,在查詢現任立委名單時竟生成錯誤人名與委員會資訊;詢問國科會副主委人選時也答錯性別與姓名。更根本的問題在於,模型將Threads的「脆」誤判為抖音或TikTok,也以中國大陸譯名《潛行空間》輸出電影《全面啟動》——這些錯誤看似瑣碎,卻精準地揭示了台灣AI對本土語境、文化符號與政治現實的掌握鴻溝。
數位部已於2025年12月啟動「台灣主權AI訓練語料庫」,截至2026年1月已累積超過11億tokens,目標是建立能反映台灣文化特徵與觀點的高品質傳統中文資料集。文化部、教育部與國防部皆已貢獻旗下資料,涵蓋文物遺產、政策文件與交通數據等領域。然而,專家指出,台灣的資料量可能只有其他主權AI國家(如法國、日本)的百分之一甚至千分之一,若沒有長期政府補貼,主權AI能否持續運作仍是未知數。
資料、模型、算力、框架:四大支柱的失衡
NVIDIA在《主權AI的四大技術支柱》報告中揭示,主權AI的核心需要「資料基準」、「模型」、「算力基建」與「框架」四大支柱同時到位。台灣的困境在於:算力正透過政府投資追趕,但資料的數量與品質仍是最大瓶頸。哈佛肯尼迪學院研究人員朱宸佐指出,台灣缺乏大規模的傳統中文訓練語料,不足以支持真正具備台灣文化敏感度的模型訓練。
此外,當基礎模型逐步商品化,資料本身才是真正的護城河。台灣在醫療、製造與公共治理領域擁有高品質的專有資料,但這些資料往往分散在不同機構,尚未形成可規模化訓練的語料庫。Taiwan AI Labs的FedGPT採用「聯邦式資料治理」架構——不同機構(醫院、企業、政府單位)將資料留在本地,訓練各自領域的專家模型——或許是台灣在資源有限條件下的務實路徑。
從人才紅利到算力分配:被忽略的關鍵變數
簡立峰曾在演講中指出,台灣的唯一勝算在於「人才密度」的極大化。在人口持續萎缩的背景下,AI能力的培養應被視為超越電力與能源的國家級基礎建設。然而,當前政策對算力資源的分配是否公平、是否能真正惠及本土AI開發社群,仍是未知數。
行政院已於2026年5月21日宣布成立「國家AI策略特別委員會」,要求各政府機關於7月前完成AI使用風險評估,並於一年內實施內部控制規範。數位部將主導AI風險分類框架、驗證工具與資料管理法規的制定。這些措施顯示政府已開始正視AI治理的系統性需求,但從法規到實際執行的距離,仍需要產官學界的持續努力。
參考來源:本網站:AI Expo 2026 - Taiwan steps up sovereign AI efforts、The Storm Media:Taiwan Pushes for Sovereign AI, Faces Shortage of Language Data、Dispatches AI:Whose Values? On Taiwan's AI Sovereignty、Taipei Times:Taiwan AI corpus grows to 1.1bn data units、TaiwanPlus:Taiwan Pushes Sovereign AI as a Matter of National Security