2026–2027 推理成本之戰:Anthropic 長約 vs. OpenAI 多供應商
前言|Why Matters
Anthropic 與 Google Cloud 官宣的超大型 TPU 供應長約(最多 100 萬顆 TPU、>1 GW、2026 年起陸續上線)與近期 OpenAI 的多供應商佈局(Oracle 長約 + NVIDIA 拟投資)同時落地,為 2026–2027 年的模型再訓練與推理放量,提供了更可預期的供給與成本曲線。本文基於已公開消息與可比定價基準,梳理兩家主角在「供給保證 × 成本鎖定 × 放量時程」上的結構性差異,供長期關注 AI 雲與應用商業化的讀者參考。
來源:Anthropic 官方新聞、Google Cloud 價目、Reuters 等(文內附連結)。
TL;DR
- 策略框架:Anthropic 用長約+可比 TPU 公開價換取穩定交付與成本可預期;OpenAI 以多供應商(Oracle 長約、Azure 存量、NVIDIA 資本+供貨)換取彈性與全球放量韌性。
- 時程關鍵:2026 是雙方的大檔期:Anthropic >1 GW 上線;OpenAI 的 GW 級 NVIDIA 系統預計 2026 H2 起陸續交付。
- 商業節奏:OpenAI 以 7–8 億 WAU 驅動高推理支出,需要更優硬體與商約來守毛利;Anthropic 以 B2B 為主(企業客戶 >30 萬)追求較佳單客價與續約。
- 財務目標:Anthropic 指引 $9B run-rate(2025E)→ $20–26B(2026);OpenAI 2025H1 營收 $4.3B。
- 定價參考:Google 公布 $/chip-hr 基準(v5e、v5p、Trillium)提供跨廠比較的「單價坐標」。
主內容|Deep dive
1) 供給與資本:兩條路的一致目標——把推理成本鎖進可預期曲線
- Anthropic × Google Cloud:官宣可用最多 100 萬顆 TPU、>1 GW 能力,2026 年起上線;金額區間「數十億至高數十億美元」,屬近年雲端最大級長約之一。來源
- OpenAI × Oracle / NVIDIA / Azure:與 Oracle 簽訂約 $300B/5 年 的算力採購協議(媒體報導),並獲 NVIDIA 擬投資至多 $100B(意向/分期);加上既有 Azure 容量,形成多供應商韌性網。Reuters 1|WSJ|Reuters 2
2) 可比定價基準:以 $/chip-hour 做跨雲橫向
- Google TPU 公開價(依區域/承諾期):
- v5e:$0.54–$1.20/chip-hr
- v5p:$1.89–$4.20/chip-hr
- Trillium:$1.22–$2.70/chip-hr
以上提供跨公司、跨世代的單位成本坐標,用於估算推理/訓練支出區間與毛利敏感度。Google Cloud
3) 時程與節點:2026 為放量臨界年
- Anthropic:>1 GW 能力自 2026 年起 陸續點亮,綁定長約交付節奏。Anthropic 官網
- OpenAI:GW 級 NVIDIA 系統預計 2026 H2 起逐步交付,配合多雲分布擴大地域覆蓋與冗餘。Reuters
4) 規模與營收:需求端如何回填供給端的賭注
- OpenAI:2025H1 營收 約 $4.3B;2025/7–10 期間 週活 7–8 億(不同媒體口徑)。Reuters
- Anthropic:2025E $9B run-rate、2026 年 $20–26B 目標;企業客戶 >300,000。Reuters
5) 融資與資本結構:誰更能撐長約與前期折舊
- Anthropic:Series F $13B、估值 $183B(2025/9)。公司公告
- OpenAI:**SoftBank 領投最高 $40B(估值 $300B)**+二級市場增資;另有 NVIDIA 擬投資 配套(仍視最終協議/監管)。OpenAI|Reuters
6) 一張表看懂(同一基準欄位)
單位說明:雲端單價採 $/chip-hr;擴張時程以上線年份/GW 等級;規模以 WAU/Run-rate。
| 指標 | OpenAI | Anthropic(Claude) |
|---|---|---|
| 主要算力供應 | Oracle(約 $300B/5 年,報導)、Microsoft Azure(長期主力)、NVIDIA(擬投資+供貨) | Google Cloud(最多 100 萬 TPU、>1 GW 自 2026 起;另有 Amazon、NVIDIA 關係) |
| 雲/硬體成本基準 | 以公有雲加速器計價觀察(Azure/Oracle 商業談判價,未公開) | TPU 公開價:v5e $0.54–$1.20;v5p $1.89–$4.20;Trillium $1.22–$2.70($/chip-hr) |
| 擴張時程 | 2025–2030 超大採購/建置;NVIDIA 系統 2026H2 起交付 | 2026 年起 陸續點亮 >1 GW |
| 營收/用戶 | 2025H1 $4.3B;WAU 7–8 億 | 2025E $9B run-rate;2026E $20–26B;企業客戶 >300,000 |
| 融資/資金 | SoftBank 最高 $40B(估值 $300B);NVIDIA 擬投資至多 $100B | Series F $13B、估值 $183B(2025/9) |
來源:
Anthropic × Google 長約與時程:Anthropic 官網|Reuters
OpenAI × Oracle / NVIDIA / Azure:Reuters 1|WSJ|Reuters 2
定價基準:Google Cloud TPU 價目
營收/規模:OpenAI 2025H1|Anthropic 目標
融資:Anthropic F 輪|OpenAI 融資更新
7) 可操作觀點|Operator’s notes
- 長約 vs. 多供應商
- 長約(Anthropic):以公開可比的 TPU 單價與明確上線節點,對 B2B 客戶更易簽訂多年合約與 SLA。
- 多供應商(OpenAI):以供應韌性+地域覆蓋換規模彈性,議價力強,但單位成本揭露度低(商約價主導)。
- 2026 佈局
- Anthropic 的 >1 GW 與 OpenAI 的 GW 級 NVIDIA 系統在 2026 匯流,推理成本下行與新一輪大訓練可能在 2026–2027 集中釋放。
- 需求與毛利管理
- OpenAI:7–8 億 WAU → 持續優化硬體效率與雲價條款以維持毛利。
- Anthropic:企業導向(~80%) → 重 SLA 與客戶續約,執行品質與交付穩定性為關鍵。
結論|Takeaways
- 相同目標,不同路徑:兩者都在把「推理成本」壓進更可預期的曲線,以承接 2026–2027 的訓練與推理放量。
- 投資/採購指標:關注(1)實際上線節奏(GW 級系統落地的月度節點)、(2)單位成本曲線相對 TPU 公開價的折扣幅度、(3)需求端韌性(WAU 與 B2B 續約),三者將共同決定模型單次推理的邊際成本與毛利天花板。
- 對產業的意義:定價透明度提升與長約/多雲的併行,將把 AI 服務的成本基礎拉向更可測、可議價、可擴張的軌道,壓縮中小供應商僅憑「算力套利」的空間,逼近「產品與場景」的真正競爭。
補充說明:算力單位,白話一次講清楚
- 「TPU / GPU 數量」:就像工廠的「機器台數」。100 萬顆 TPU 代表非常多的「機器」可同時工作。
- 「chip-hour(每顆每小時)」:雲端會用 $/chip-hour 計價(例如 $1.20/chip-hr),類似「租一台機器一小時要多少錢」。因此 10,000 chip-hours 就是「1 萬台機器各跑 1 小時」或「1,000 台機器各跑 10 小時」,本質上是使用量。(Google Cloud)
- 「GW(吉瓦)」:是電力容量的單位,1 GW = 10 億瓦。如果一年 24/7 全速運轉,約消耗 8.76 TWh 的電(只是上限概念,實際會看利用率)。媒體常用「1 GW ≈ 30–40 萬戶家庭用電」來幫大家理解量級。Anthropic 與 Google 的協議就是把**>1 GW** 的 AI 算力在 2026 年陸續上線。(AP News)
- 為何要同一基準? 因為每家公司談判價不同、機型不同,直接比「總金額」很容易失真,所以我們用 $/chip-hour(單價)與 GW / 上線年份(規模+時程)來對齊比較口徑。