2024-09-12_ORCL_OCI-Supercluster
Oracle OCI 雲端超級電腦
☘️Article
- Oracle says it is building a 'zettascale' cloud cluster, with up to 131,072 Nvidia Blackwell GPUs - DCD
- DCD
- Oracle says it is building a 'zettascale' cloud cluster, with up to 131,072 Nvidia Blackwell GPUs
- OCI Supercluster expected to be the largest AI supercomputer in the cloud
💡Abstract
- Oracle 宣佈正在打造一個名為「OCI Supercluster」的雲端超級電腦,預計於 2025 年上半年推出,將搭載高達 131,072 個 NVIDIA Blackwell GPU,並擁有 2.4 zettaflops 的峯值效能。
- OCI Supercluster 的規模超乎想像,GPU 數量是全球最強大的超級電腦「Frontier」的三倍以上,更是其他雲端服務提供商的六倍以上。
- 雖然 Oracle 並未明確説明所有 131,072 個 GPU 是否會在推出時就全數上線,但這項計畫規模之大令人驚嘆。
- OCI Supercluster 將提供多種配置,包括搭載 NVIDIA H100 GPU、H200 GPU 和 Blackwell GPU 的版本。
- 其中,H100 Supercluster 可擴展至 16,384 個 GPU,峯值效能可達 65 exaflops;而 H200 Supercluster 則可擴展至 65,536 個 GPU,峯值效能可達 260 exaflops。
- 值得一提的是,OCI Supercluster 將利用 NVIDIA 的 GB200 NVL72 液冷裸機實例,通過 NVLink 和 NVLink Switch 技術,讓最多 72 個 Blackwell GPU 在單個 NVLink 域中以 129.6 TBps 的總頻寬互相通信。
- 目前尚未公佈最大規模的 OCI Supercluster 的具體位置。
- 然而,Oracle 創辦人 Larry Ellison 昨日表示,公司目前在全球擁有 162 個雲端資料中心正在運營或建設中,其中最大的資料中心容量為 800MW。
- 此外,Oracle 還計劃建設一個由三個小型模組化核反應堆供電的千兆瓦資料中心。
- 總之,Oracle 的 OCI Supercluster 旨在打造全球最強大的 AI 超級電腦,將為各種 AI 工作負載提供強大的計算能力,進一步推動雲端 AI 的發展。