オラクルがZettascale10 AIスーパーコンピュータ発表、クラウド最大規模

複数のデータセンターにまたがる数十万基のNvidia GPUを接続

Oracle(オラクル)は、Oracle Cloud Infrastructure(OCI)Zettascale10 AIスーパーコンピュータを発表しました。

Zettascale10スーパーコンピュータは、複数のデータセンターにまたがる数十万基のNvidia GPUで構成され、マルチギガワット級のクラスターを形成しています。オラクルによると、これにより最大16ゼッタフロップスのピークAI性能(通常はFP8またはFP16)を達成する可能があるとのことです。

2026年後半に、提供される予定です。

同社は、このスーパーコンピュータが「クラウド上で最大のAIスーパーコンピュータ」になると主張しています。

Zettascale10は、オラクルのAcceleron RoCEネットワーク基盤上に構築され、Nvidia AIインフラを採用します。これは、テキサス州アビリーンにある、OpenAI Stargateクラスターを支える基盤技術でもあります。

OpenAIのインフラストラクチャ&産業コンピューティング担当バイスプレジデントであるPeter Hoescheleは、次のように述べています。「OCI Zettascale10のネットワークとクラスターファブリックは、テキサス州アビリーンにあるStargateのフラッグシップサイト(オラクルとの共同スーパーコンピュータークラスター)で最初に開発・導入されました。この高いスケーラビリティを持つカスタムRoCE設計は、GW規模でファブリック全体の性能を最大化しながら、電力の大部分を計算処理に集中させることができます。私たちは、アビリーンおよびStargateプログラム全体のさらなるスケーリングに向けて、これからも協力できることを楽しみにしています。」

オラクルは、最終的にZettascale10のマルチギガワットクラスターを顧客に提供する計画ですが、まずは80万基のNvidia GPU導入を目標としています。

Nvidiaのハイパースケール担当バイスプレジデントであるIan Buckは、「オラクルとNvidiaは、OCIの分散型クラウドと当社のフルスタックAIインフラを統合し、驚異的な規模でのAI提供を実現します。OCI Zettascale10は、最先端のAI研究を推進し、あらゆる組織が実験段階から産業化AIへ移行するために必要なコンピューティングファブリックを提供します」と述べました。

オラクルは2024年9月、ゼタスケール規模のクラウドクラスター計画を発表していました。同クラスターは、Nvidia Blackwell GPU 131,072基を搭載し、2025 年上半期に発売される予定でした。

この記事は海外Data Centre Dynamics発の記事をData Center Cafeが日本向けに抄訳したものです。

関連記事一覧

  1. この記事へのコメントはありません。