TPU

張量處理器 (Tensor Processing Unit)

概念股

供應鏈環節 概念股
晶片設計、協作 聯發科 (2454)、創意電子 (3443)
晶圓製造 台積電 (2330)
封裝測試 日月光投控 (3711)、京元電子 (2449)
高階板材、載板 金像電 (2368)、台光電 (2383)、欣興 (3037)
AI 伺服器整合 鴻海 (2317)、廣達 (2382)、英業達 (2356)、緯穎 (6669)
機構件 勤誠 (8210)
散熱、液冷 奇鋐 (3017)、邁科 (6831)
電源供應 台達電 (2308)
光通訊 光聖 (6442)、聯亞 (3081)、華星光 (4979)、光環 (3234)
測試驗證 旺矽 (6223)、精測 (6510)

TPU 世代

年份 世代 代號 主要角色 供應鏈 觀察重點
2027E–2028E TPUv9x Humufish Inference MTK、Intel EMIB-T、台積電 CoWoS 市場消息稱為次世代推論用客製 ASIC,可能評估 台積電 CoWoS、Intel EMIB-T 兩種封裝路線
2026E–2027E TPU 8t Zebrafish Training Google、MTK、CoWoS 4Q26;
運算設計服務由 Google,I/O 與後段設計服務由聯發科;
運算與 I/O 晶粒各 1 × N3P
2026E TPU 8i Sunfish Inference Broadcom、CoWoS 3Q26;運算、I/O、後段設計服務由 Broadcom;運算與 I/O 晶粒各 2 × N3P
2025 TPU7x Ironwood Inference Broadcom Google TPU 既有主力推論產品線,強調即時生成與能效比
2025 TPU7ax Ironwood Training Broadcom Google TPU 既有主力訓練產品線,支援大規模任務並提升擴展性
2024 TPU v6 Trillium - - 計算力為前代 4.7 倍;記憶體頻寬加倍;最佳化大型模型訓練與雲端部署
2021–2023 TPU v5 系列 - - - 加強矩陣運算 (MXU) 與頻寬,專攻生成式 AI;Pod 部署大規模化
2019 TPU v4 - - - 採 7 奈米製程、3D torus 互連;單 Pod 達 1.1 exaflops;雲端可用
2018 TPU v3 - - - 引入液冷散熱;Pod 規模擴大至 1,024 顆;提升大型模型訓練效能
2017 TPU v2 - - - 支援 訓練、推論
導入 HBM
首次引入 TPU Pod 設計
2016 TPU v1 公開 - - - Google I/O 首次對外公開 TPU,引起 AI 硬體關注
2015 TPU v1 內部部署 - - - 初步部署於 語音辨識、搜尋 等推論任務,於 Google 內部廣泛應用
2013 TPU 研發啟動 - - - 預判 AI 將造成運算壓力
自研 ASIC 作為 CPU/GPU 替代方案

未知

2027E TPU v8p (TBD) - TBD Broadcom、CoWoS / SoIC 4Q27
運算、I/O、後段設計服務由 Broadcom
運算晶粒 2 奈米,I/O 晶粒 3 奈米
2027E TPU v8e (TBD) - TBD Google、MTK、EMIB 4Q27
運算設計服務由 Google,I/O 與後段設計服務由聯發科
運算晶粒 2 奈米,I/O 晶粒為 3 奈米 336G SerDes

第九代

第八代

第七代

第六代

第五代

第四代

第三代

第二代

第一代與早期研發

定義

核心架構

實際應用

優勢

限制與挑戰