推理經濟成形 Groq、Cerebras、SambaNova、Hailo 四路新創卡位 AI 推論市場
【2026-06-12】當 NVIDIA 仍在 AI 訓練市場握有八成以上市占,「推論經濟(inference economy)」卻正快速裂解出多家估值破百億美元的新創勢力。CNBC 6 月 9 日的盤點指出,由微軟背書的 D-Matrix 加入戰局,與 Groq、Cerebras、SambaNova、Tenstorrent 形成「GPU 主導以外」的第二戰場;DIGITIMES 與 TrendForce 同步示警,OpenAI 與 NVIDIA 各別對新創投入 200 億美元已成事實,雲端推論支出預估 2027 年將首度超越訓練。邊緣端的代表 Hailo 雖在 4 月宣布裁員 50%、估值砍半,卻在 5 月端出業界首款支援 on-device 生成式 AI 的 Hailo-10H,並傳出將透過 SPAC 赴美掛牌——AI 推論市場正式進入「買晶片不一定要找 NVIDIA」的多極新時代。
這場「推論市場多極化」的最戲劇化訊號,是 2025 年底 NVIDIA 與 Groq 之間高達 200 億美元的授權與挖角協議。商周報導,黃仁勳親自拍板這筆交易,不僅取得 Groq 旗下 LPU(語言處理器)核心專利的非專屬授權,更一口氣延攬創辦人 Jonathan Ross 與多位首席工程師,被市場視為「NVIDIA 用鈔票換時間、提前卡位低延遲推論」的戰略豪賭。Groq 走的是 SRAM 靜態記憶體架構,繞過 GPU 仰賴的 HBM 與外部記憶體瓶頸,主打「單次推論 token 延遲 < 1ms」的雲端即時推論工作負載;協議完成後 Groq 估值翻倍至 600 億美元,並啟動新一輪與 AWS、GCP 之外的雲端推論服務。DIGITIMES 4 月 26 日的深度報導直言,NVIDIA 與 OpenAI 各別對新創投入 200 億美元的共同點,是「兩家都不願把雞蛋全放在 GPU 訓練叢集上」。
在雲端推論的另一端,晶圓級 AI 晶片獨角獸 Cerebras Systems 已於 2026 年 1 月正式遞件 IPO,是這波「NVIDIA 挑戰者」中第一家走到公開市場的公司。WSJ 與 CNBC 報導,Cerebras S-1 揭露的關鍵數字包括:與 OpenAI 簽下的 100 億美元、為期三年以上的算力長約;與 AWS 在 2026 年 3 月宣布的策略聯盟,把 WSE(Wafer-Scale Engine)晶片正式導入 AWS 雲端實例,與既有的 Trainium 2/3 形成雙軌;以及創辦人 Andrew Feldman 在 5 月 14 日 HPCwire 專訪中所言「GPU 的 scaling 模式正面臨功耗與互連瓶頸,wafer-scale 是繞開這條死胡同的捷徑」。Cerebras 重啟 IPO 後的目標估值上看 480 億美元,AI Business 將其定調為「GPU 單一生態的終結者」,而 The Futurum Group 則認為 S-1 揭露的客戶集中度(OpenAI 佔比過高)是潛在風險。
第三股勢力 SambaNova Systems 走的是企業級生成式 AI 的路線。The Register 2 月 25 日報導,AI 晶片新創當週合計吸金 11 億美元,其中 SambaNova 完成由 Vista Equity Partners 與 Intel 共同領投的新一輪融資,金額落在 6.5 億至 8 億美元之間,估值上看 110 億美元。SambaNova 主打的 dataflow 架構與 Groq 的 LPU、Tenstorrent 的 Ascalon 都屬於「非 GPU、非純 TPU」的第三類架構,差別在於 SambaNova 鎖定的是企業私有雲(on-premise)的推論需求——客戶名單包括美國能源部國家實驗室、ConocoPhillips 與多家歐洲電信商。TechOrange 科技報橘分析,這幾家新創「不是要取代 NVIDIA,而是要瓜分雲端推論那塊 NVIDIA 訓練之外的高毛利市場」——一旦推理經濟成形,GPU 巨頭在雲端的「訓練+推論」一條龍模式將被迫拆解。
邊緣端的代表 Hailo,劇情則是冰火兩重天。CTech 與 Globes 4 月 8 日同步報導,這家曾經估值 10 億美元的以色列獨角獸宣布裁員 50%、估值砍半至不到 5 億美元,主因是 2024-2025 年 edge inference 市場成長不如預期,加上中國地緣政治壓力使其失去部分車用 Tier-1 客戶。然而僅僅一個多月後,Hailo 在 5 月 15 日端出業界首款支援 on-device 生成式 AI 的邊緣晶片 Hailo-10H,EdgeIR 報導其關鍵規格為 40 TOPS INT8 算力、功耗低於 5 瓦,能在無網路環境下直接執行 7B 參數等級的 LLM。SiliconANGLE 5 月 9 日率先披露,Hailo 已與一家美國空白支票公司(SPAC)簽署合併協議,預計 2026 年 Q4 在 NYSE 掛牌,目標估值 12 億美元——這是邊緣 AI 晶片新創首次進入主流資本市場的指標案例。
把四家放在一起看,會發現 AI 推論市場正出現清晰的**雙軸分裂**。第一條軸是「雲端 vs 邊緣」:Groq、Cerebras、SambaNova 集中在雲端資料中心推論,鎖定的是 hyperscaler 與大型企業;Hailo 則鎖定車用、工業、零售、國防等邊緣應用,與雲端市場幾乎不重疊。第二條軸是「訓練相容 vs 異質架構」:Cerebras 的 WSE 雖是異質架構,但仍強調可與 PyTorch / JAX 訓練好的模型對接;Groq 與 SambaNova 則要求客戶重新編譯或客製化 runtime,換取更低的單 token 成本。TrendForce 6 月 7 日的「推理經濟時代來臨」報告直言,這場多極化不會是零和遊戲——OpenAI、Microsoft、Anthropic 為了不把雞蛋放在 NVIDIA 籃子裡,已各自投入數十億美元洽購或自研推論晶片。
對台灣半導體與伺服器供應鏈而言,這場多極化的實質意義至少有兩層。第一,**先進封裝與 HBM 仍是共同瓶頸**——Cerebras 的 WSE-3 仍交由台積電代工、封裝採用 CoWoS-S;Groq 與 SambaNova 的新一代晶片也高度依賴 CoWoS-L 與 HBM3E/HBM4,這意味著即使非 NVIDIA 陣營崛起,台積電與 SK 海力士的議價能力並未受損。第二,**AI 機櫃與散熱設計將更為碎片化**——不同新創採用不同功耗曲線(Groq LPU 約 200W、Cerebras WSE-3 達 650W、SambaNova RDU 介於中間),意味著緯創、廣達、奇鋐、雙鴻等機櫃與散熱廠必須為每一種新架構客製化設計,毛利率結構可能優於現行的 NVIDIA Blackwell/Rubin 統一機櫃。DIGITIMES 與科技新報整理,近兩個月內已有至少 6 家台廠接觸 Cerebras 與 SambaNova 洽談 AI 機櫃 ODM 合作,2026 下半年非 NVIDIA 陣營的 ODM 訂單可望開始貢獻營收。
後續觀察重點有三:**第一**,Cerebras 的 IPO 定價與首日表現,將決定 SambaNova、Tenstorrent 等同業是否跟進在 2027 年掛牌;**第二**,Hailo 的 SPAC 合併能否在 Q4 順利完成,將是邊緣 AI 晶片能否從燒錢走向獲利的關鍵試金石;**第三**,NVIDIA 與 Groq 之間的 200 億美元協議是否觸發新一輪「GPU 巨頭收購/挖角 AI 晶片新創」的連鎖效應——CNBC 已點名 Microsoft 背書的 D-Matrix 是下一個可能被鎖定的目標。短期內,AI 推論市場的多極化才剛剛開始;長期來看,TrendForce 預估 2027 年全球 AI 推論晶片市場規模將達 1,850 億美元,其中非 NVIDIA 陣營合計市占將從 2025 年的不到 5% 攀升至 18-22%。「推理經濟」不再只是 NVIDIA 的延伸賽,而是半導體產業下一個十年的主戰場。
參考來源
- CNBC(2026-06-09):Upstart chipmakers keep challenging Nvidia. This time it's Microsoft-backed D-Matrix
- DIGITIMES(2026-04-26):Nvidia and OpenAI both make US$20 billion bets on AI chip startups: what's the common factor?
- TrendForce(2026-06-07):推理經濟時代來臨:AI 晶片的規則正被重寫
- TechNews 科技新報(2026-06-07):推理經濟時代來臨:AI 晶片的規則正被重寫
- The Register(2026-02-25):AI chip startups soak up $1.1B in VC funding this week
- HPCwire(2026-05-14):Cerebras IPO Signals Growing Pressure on the GPU Scaling Model
- SiliconANGLE(2026-05-09):Report: Edge AI chip startup Hailo to go public via SPAC merger
- CTech / Calcalist(2026-04-08):Former unicorn Hailo cuts 50% of workforce amid funding pressure and strategic reset
- Globes — Israel Business News(2026-04-08):Hailo lays off 50% of workforce
- EdgeIR(2026-05-15):Hailo-10H debuts as first edge AI chip for on-device generative models
- Blockonomi(2026-03-13):AWS Partners With Cerebras to Challenge Nvidia's AI Chip Dominance
- AI Business(2026-01-15):Cerebras Poses an Alternative to Nvidia With $10B OpenAI Deal
- 數位時代 / Business Next(2026-01-08):輝達狂擲200億美元挖走Groq團隊:黃仁勳對「AI推論時代」的豪賭
- TechOrange 科技報橘(2026-05-12):【NVIDIA 另類對手進逼】Cerebras、SambaNova 等新創瞄準 AI 推理,拿什麼以小搏大?