6 min read

2026–2027 推理成本之戰:Anthropic 長約 vs. OpenAI 多供應商

2026–2027 推理成本之戰:Anthropic 長約 vs. OpenAI 多供應商
Locking In Inference Costs: Anthropic’s Long-Term TPU Bet vs. OpenAI’s Multi-Vendor Hedge

前言|Why Matters

Anthropic 與 Google Cloud 官宣的超大型 TPU 供應長約(最多 100 萬顆 TPU、>1 GW、2026 年起陸續上線)與近期 OpenAI 的多供應商佈局(Oracle 長約 + NVIDIA 拟投資)同時落地,為 2026–2027 年的模型再訓練與推理放量,提供了更可預期的供給與成本曲線。本文基於已公開消息與可比定價基準,梳理兩家主角在「供給保證 × 成本鎖定 × 放量時程」上的結構性差異,供長期關注 AI 雲與應用商業化的讀者參考。
來源:Anthropic 官方新聞、Google Cloud 價目、Reuters 等(文內附連結)。

TL;DR

  • 策略框架:Anthropic 用長約+可比 TPU 公開價換取穩定交付與成本可預期;OpenAI 以多供應商(Oracle 長約、Azure 存量、NVIDIA 資本+供貨)換取彈性與全球放量韌性。
  • 時程關鍵2026 是雙方的大檔期:Anthropic >1 GW 上線;OpenAI 的 GW 級 NVIDIA 系統預計 2026 H2 起陸續交付。
  • 商業節奏:OpenAI 以 7–8 億 WAU 驅動高推理支出,需要更優硬體與商約來守毛利;Anthropic 以 B2B 為主(企業客戶 >30 萬)追求較佳單客價與續約。
  • 財務目標:Anthropic 指引 $9B run-rate(2025E)→ $20–26B(2026);OpenAI 2025H1 營收 $4.3B
  • 定價參考:Google 公布 $/chip-hr 基準(v5e、v5p、Trillium)提供跨廠比較的「單價坐標」。

主內容|Deep dive

1) 供給與資本:兩條路的一致目標——把推理成本鎖進可預期曲線

  • Anthropic × Google Cloud:官宣可用最多 100 萬顆 TPU>1 GW 能力,2026 年起上線;金額區間「數十億至高數十億美元」,屬近年雲端最大級長約之一。來源
  • OpenAI × Oracle / NVIDIA / Azure:與 Oracle 簽訂約 $300B/5 年 的算力採購協議(媒體報導),並獲 NVIDIA 擬投資至多 $100B(意向/分期);加上既有 Azure 容量,形成多供應商韌性網。Reuters 1WSJReuters 2

2) 可比定價基準:以 $/chip-hour 做跨雲橫向

  • Google TPU 公開價(依區域/承諾期):
    • v5e:$0.54–$1.20/chip-hr
    • v5p:$1.89–$4.20/chip-hr
    • Trillium:$1.22–$2.70/chip-hr
      以上提供跨公司、跨世代的單位成本坐標,用於估算推理/訓練支出區間與毛利敏感度。Google Cloud

3) 時程與節點:2026 為放量臨界年

  • Anthropic>1 GW 能力自 2026 年起 陸續點亮,綁定長約交付節奏。Anthropic 官網
  • OpenAIGW 級 NVIDIA 系統預計 2026 H2 起逐步交付,配合多雲分布擴大地域覆蓋與冗餘。Reuters

4) 規模與營收:需求端如何回填供給端的賭注

  • OpenAI:2025H1 營收 約 $4.3B;2025/7–10 期間 週活 7–8 億(不同媒體口徑)。Reuters
  • Anthropic:2025E $9B run-rate2026 年 $20–26B 目標;企業客戶 >300,000Reuters

5) 融資與資本結構:誰更能撐長約與前期折舊

  • AnthropicSeries F $13B、估值 $183B(2025/9)公司公告
  • OpenAI:**SoftBank 領投最高 $40B(估值 $300B)**+二級市場增資;另有 NVIDIA 擬投資 配套(仍視最終協議/監管)。OpenAIReuters

6) 一張表看懂(同一基準欄位)

單位說明:雲端單價$/chip-hr擴張時程以上線年份/GW 等級;規模WAU/Run-rate
指標 OpenAI Anthropic(Claude)
主要算力供應 Oracle(約 $300B/5 年,報導)、Microsoft Azure(長期主力)、NVIDIA(擬投資+供貨) Google Cloud(最多 100 萬 TPU>1 GW 自 2026 起;另有 Amazon、NVIDIA 關係)
雲/硬體成本基準 以公有雲加速器計價觀察(Azure/Oracle 商業談判價,未公開) TPU 公開價:v5e $0.54–$1.20;v5p $1.89–$4.20;Trillium $1.22–$2.70($/chip-hr)
擴張時程 2025–2030 超大採購/建置;NVIDIA 系統 2026H2 起交付 2026 年起 陸續點亮 >1 GW
營收/用戶 2025H1 $4.3B;WAU 7–8 億 2025E $9B run-rate2026E $20–26B;企業客戶 >300,000
融資/資金 SoftBank 最高 $40B(估值 $300B)NVIDIA 擬投資至多 $100B Series F $13B、估值 $183B(2025/9)
來源:
Anthropic × Google 長約與時程:Anthropic 官網Reuters
OpenAI × Oracle / NVIDIA / Azure:Reuters 1WSJReuters 2
定價基準:Google Cloud TPU 價目
營收/規模:OpenAI 2025H1Anthropic 目標
融資:Anthropic F 輪OpenAI 融資更新

7) 可操作觀點|Operator’s notes

  1. 長約 vs. 多供應商
    • 長約(Anthropic):以公開可比的 TPU 單價與明確上線節點,對 B2B 客戶更易簽訂多年合約與 SLA。
    • 多供應商(OpenAI):以供應韌性+地域覆蓋換規模彈性,議價力強,但單位成本揭露度低(商約價主導)。
  2. 2026 佈局
    • Anthropic>1 GWOpenAIGW 級 NVIDIA 系統2026 匯流,推理成本下行新一輪大訓練可能在 2026–2027 集中釋放。
  3. 需求與毛利管理
    • OpenAI7–8 億 WAU → 持續優化硬體效率與雲價條款以維持毛利。
    • Anthropic企業導向(~80%) → 重 SLA 與客戶續約,執行品質與交付穩定性為關鍵。

結論|Takeaways

  • 相同目標,不同路徑:兩者都在把「推理成本」壓進更可預期的曲線,以承接 2026–2027 的訓練與推理放量。
  • 投資/採購指標:關注(1)實際上線節奏(GW 級系統落地的月度節點)、(2)單位成本曲線相對 TPU 公開價的折扣幅度、(3)需求端韌性(WAU 與 B2B 續約),三者將共同決定模型單次推理的邊際成本與毛利天花板。
  • 對產業的意義定價透明度提升長約/多雲的併行,將把 AI 服務的成本基礎拉向更可測、可議價、可擴張的軌道,壓縮中小供應商僅憑「算力套利」的空間,逼近「產品與場景」的真正競爭。

補充說明:算力單位,白話一次講清楚

  • 「TPU / GPU 數量」:就像工廠的「機器台數」。100 萬顆 TPU 代表非常多的「機器」可同時工作。
  • 「chip-hour(每顆每小時)」:雲端會用 $/chip-hour 計價(例如 $1.20/chip-hr),類似「租一台機器一小時要多少錢」。因此 10,000 chip-hours 就是「1 萬台機器各跑 1 小時」或「1,000 台機器各跑 10 小時」,本質上是使用量。(Google Cloud)
  • 「GW(吉瓦)」:是電力容量的單位,1 GW = 10 億瓦。如果一年 24/7 全速運轉,約消耗 8.76 TWh 的電(只是上限概念,實際會看利用率)。媒體常用「1 GW ≈ 30–40 萬戶家庭用電」來幫大家理解量級。Anthropic 與 Google 的協議就是把**>1 GW** 的 AI 算力在 2026 年陸續上線。(AP News)
  • 為何要同一基準? 因為每家公司談判價不同、機型不同,直接比「總金額」很容易失真,所以我們用 $/chip-hour(單價)與 GW / 上線年份(規模+時程)來對齊比較口徑。