MetaがOCP サミットでAIシステムと液冷ラックを発表

Grand Tetonを公開、Open Rack Ver.3もアップデート

FacebookのオーナーMetaは、ハイパースケールプレイヤーがコストを抑えたオープンソースハードウェア設計を万人に提供するOpen Compute Platform(OCP)サミットで、AIプラットフォームの設計を発表しました。

OCPのOpen Rack v3規格の新しい実装と、新しいHDDストレージシステムとともに、Grand Teton AIプラットフォームを公開しています。

また、OCPは今回のサミットを利用して、サステナビリティをサポートすることを発表しました。

「AIモデルがますます洗練されていくにつれて、それに関連するワークロードも洗練されていきます」と、Metaのエンジニアリング担当VP Alexis Bjorlinは、ブログ記事の発表で述べています。GPUベースのAIハードウェアプラットフォーム「Grand Teton」は、先代Zionの4倍の帯域幅を持ち、Zionが複数のサブシステムでパッケージ化されていたのに対し、単一の統合シャーシで提供されます。

「前世代のZionプラットフォームは、CPUヘッドノード、スイッチ同期システム、GPUシステムの3つのボックスで構成されており、すべてを接続するために外部ケーブルが必要でした」とBjorlin氏は言います。「Grand Tetonはこれを1つの筐体に統合し、電源、制御、コンピュート、ファブリックの各インターフェイスを完全に統合して、総合性能、シグナルインテグリティ、熱性能を向上させています。」

Open Rack V3 – 待つ価値はあり?

2019年に発表されたOpen Rack V3は、DCバスバーと液冷を可能にし、Metaの最新ラックはこれを実装・強化したものです。ラック内のどこにでも電源を設置でき、1本のバスバーに複数を設置できるため、電力密度は1ラックあたり30kWまで可能です。ORV3で許された48Vの配電は、Grand Tetonのような電力消費の激しいAIハードウェアをサポートします。

Facebookはバッテリーバックアップユニットをアップグレードし、電源が遮断された場合、各ラックは従来の90秒の制限から4分間動作を継続できるようになりました。このユニットはフレキシブルに設置可能で、15kWに対応し、30kWのラックには2台設置することができます。

ラックウォッチャーは、発表から納品まで時間がかかったと感じるかもしれないが、Bjorlin氏は、これはオープンソース、コミュニティ主導のOCPプロセス特有のものであり、待つだけの価値はあると言われています。

「Metaは、ORV3の設計のほぼすべてのコンポーネントを、最初からOCPで開発することを選択しました」と Bjorlin は説明します。「エコシステム主導の設計は、従来の自社設計よりも設計プロセスが長くなる可能性がありますが、最終的な製品は、柔軟性の向上、サプライヤーの完全な相互運用性、多様なサプライヤーのエコシステムによって、大規模に展開できる全体的なインフラソリューションとなります。」

電力レベルの上昇に伴い、ORV3 では、空冷式液冷(AALC)や、ラックを循環システムに接続する施設水冷など、複数の液冷オプションを使用できます。

ORV3には、2020年にMetaが設立したORV3 Blind Mate Interfaces Groupから生まれた、高速でノンドリップの「ブラインドメイト」コネクタのオプションが追加されました。OCP標準仕様では、コネクタ、マニホールド、ホース、チューブの要件が規定されています。

Bjorlinは、Meta社で液冷がもっと普及する必要があることを示唆しています。「なぜMetaはこのような分野に力を入れているのかと思われるかもしれません。我々が見ている電力トレンドの上昇と、液冷の進歩の必要性から、プラットフォーム、ラック、電力、データセンターの設計のすべての要素について、異なる考え方をすることを余儀なくされています。」



この記事は海外Data Centre Dynamics発の記事をData Center Cafeが日本向けに抄訳したものです。



関連記事一覧

  • コメント ( 0 )

  • トラックバックは利用できません。

  1. この記事へのコメントはありません。