半導體.零組件

Google TurboQuant 壓縮演算法引爆記憶體股跳水 業界:DDR5 缺貨潮延燒到 2027 才是真正考驗

【2026-06-05】Google 於 3 月 24 日發表 AI 模型 KV 快取壓縮技術「TurboQuant」,宣稱可讓大型語言模型(LLM)的記憶體用量最高降低 6 倍、推論效能提升 8 倍。消息一出,記憶體族群股價集體跳水,DDR5 現貨價在 48 小時內回檔 8-12%。然而,PCMag 與 Wccftech 同步引述美光副總裁在 CES 2026 受訪內容,強調「TurboQuant 仍處於早期研究階段,短期內不會改變供需結構」。DIGITIMES 6 月 4 日報導指出,兩岸記憶體業界普遍認為,這波壓縮技術恐慌只是雜訊,真正的大缺貨潮將延續到 2027 年。

TurboQuant 原理:KV 快取壓縮的「6 倍省 RAM」承諾

TurboQuant 是 Google Research 發表的向量量化(vector quantization)演算法,專門針對 Transformer 架構 LLM 的 KV cache(鍵值快取)進行壓縮。根據 Google 公開論文,TurboQuant 在三項測試中將記憶體消耗壓低 6 倍、推論速度提升最高 8 倍,且「在長上下文工作負載上,使用壓縮層後與未壓縮的結果無明顯差異」。DropReference 整理的時序顯示,3 月 25 日論文公開後記憶體現貨價曾一度回落,但僅維持 72 小時即恢復漲勢。

業界對 TurboQuant 的質疑集中於「實驗室 vs 部署環境」的落差。Resell Calendar 與 Unibetter 同步指出,目前主流 LLM 服務(ChatGPT、Claude、Gemini、Llama)的推論環境高度異質,量化方案在邊界案例(edge case)上可能產生不可預測的精度損失。「Google 自己也說,這是研究階段,不是產品路線圖」,一位記憶體分析師對 Wccftech 表示。

DDR4/DDR5 現貨價實況:Q2 將觸頂、部分規格年漲 480%

Counterpoint Research 數據顯示,記憶體價格從 2025 年第四季到 2026 年第一季「季增 80-90%」,幾乎所有記憶體細分市場都經歷了 V 型反轉。Resell Calendar 預測,DDR5 64GB RDIMM 伺服器模組「將在 2026 年第二季觸頂,價格是 2025 年初的兩倍」。Unibetter 的追蹤更為驚人:32GB DDR5 套裝 2025 年中約 95 美元,2026 Q2 預估將觸及 550-600 美元,漲幅逼近 480%。

Sourceability 整理的「2026 季增時序」顯示,DDR4 與 DDR5 同步漲價且供貨被砍半,主因為三星、SK 海力士、美光同步將產能優先配置給 HBM 與 DDR5 高階伺服器模組。Counterpoint 指出,DDR4 供給急速下滑,業者堅守 EOL(停產)策略,舊製程機台甚至延後報廢以維持出貨。「DDR4 現貨價在 2026 Q2 達到與 DDR5 倒掛的歷史罕見現象」,Tom's Hardware 5 月 30 日報導。

台灣記憶體廠實況:南亞科、華邦、群聯各有盤算

南亞科(2408)5 月合併營收受惠漲價與 DDR5 良率提升,連續 4 個月創同期新高;法人圈指出,南亞科 1B 製程 DDR5 已於 Q2 進入量產,毛利率從 2025 年同期的 12% 大幅回升至 35-40% 區間。華邦電子(2344)則受惠於利基型 DRAM 與 NOR Flash 漲價,5 月營收年增 41%;執行長焦佑鈞在法說會強調「NOR Flash 供需吃緊將延續到 2027 年」。

群聯(8299)雖以 NAND 控制 IC 為主,但因 AI PC 與企業級 SSD 需求同步爆發,5 月合併營收年增 28%,創單月歷史第三高。執行長潘健成 5 月 11 日於 DIGITIMES 受訪時指出,「全球 NAND 市場嚴重失衡,ASP 將持續走高且供給吃緊」,並把 2026 年定位為「群聯 3.0 全面轉型 AI 賦能者」的關鍵年。

兩岸業界觀點:恐慌已被消化、缺貨潮才剛開始

DIGITIMES 6 月 4 日焦點報導引述兩岸記憶體業界看法,普遍認為 TurboQuant 衝擊已被市場消化,真正要關注的是「AI 推論帶動的 HBM 與 DDR5 結構性需求」。一位台系記憶體大廠高層透露:「TurboQuant 連我們內部評估都不把它列為風險因子,反而 HBM4、HBM4E 良率爬升的進度才是今年下半年的關鍵。」

中國業界的反應更為樂觀。東方財富網與 Cnyes 引述中國半導體分析師,認為 TurboQuant 反而凸顯「Google 也承認記憶體是 AI 瓶頸」,對長鑫、長江存儲是利多而非利空。一位中國 IC 設計公司高層表示:「壓縮演算法每推進一版,模型參數量與上下文長度就跟著放大,最終記憶體總用量不減反增,這就是 Jevons paradox(傑文斯悖論)在 AI 時代的真實寫照。」

後續觀察:6 月底 Computex、HBM4 量產時程、CSP 採購價

下半年記憶體市場的三大觀察節點包括:第一,6 月底至 7 月初的 Computex 與 SEMICON West,各大廠將釋出 HBM4 量產時程與產能規劃。第二,美光、SK 海力士、三星於 7-8 月發布的 Q2 法說會,將揭露 HBM 與 DDR5 客戶長約(LTA)價格,市場普遍預期「合約價年增 30-50%」。第三,Google、微軟、Meta 等 CSP 對 HBM 的採購規模將在 10 月晶片大會上公開,若年增幅低於 60% 代表需求降溫。

整體而言,TurboQuant 衝擊只是記憶體超級週期中的一段插曲。DIGITIMES 業界共識是:DDR4/DDR5 缺貨潮將延續到 2026 年底,2027 年才會隨著長鑫、長江存儲、SK 海力士新產能開出逐步緩解。台廠若能把握這段「結構性缺貨紅利期」,同步卡位 HBM 與 AI 端運算雙引擎,將是未來 18 個月的最大成長動能。

資料來源