AWSがAIをサポートする新しいデータセンター・コンポーネントを発表

エネルギー効率を高める電源、冷却、ハードウェア設計の革新など

Amazon Web Services(AWS)は、次世代のAIワークロードに対応するため、データセンターの設備を改善する一連の新しいデータセンター・コンポーネントを発表しました。

今週のAWS re:Inventでの発表によると、このイノベーションは、電力、冷却、ハードウェア設計をカバーし、AWSの施設のエネルギー効率を改善することを目的としています。

新機能は最終的にAWSの新しいデータセンター全体にグローバルに導入される予定で、一部のコンポーネントはすでに既存の施設にも導入されています。

AWSのインフラサービス担当バイスプレジデントであるPrasad Kalyanaramanは、次のように述べました。「AWSは世界中のお客様のために、最もパフォーマンスが高く、回復力があり、セキュアで持続可能なクラウドを構築するため、絶え間ないインフラ革新を続けています。これらのデータセンター機能は、エネルギー効率の向上と新たなワークロードへの柔軟な対応により、重要な一歩を踏み出したことを意味します。さらにエキサイティングなのは、モジュール式に設計されているため、既存のインフラを液冷とエネルギー効率化のために改修して、生成的なAIアプリケーションに電力を供給し、二酸化炭素排出量を削減できることです。」

電気・機械設計を簡素化

AWSは、データセンターの保守を容易にし、信頼性を高めるために、電気的および機械的設計を簡素化しました。

同社によると、これらのアップデートにより、インフラの可用性は99.9999パーセントとなり、電気的な問題によって影響を受ける可能性のあるラックの数は89パーセント減少するとのことです。

この要素のひとつは、より簡素化されたエネルギー配電設計と共に、データセンター内の電気変換の回数を20パーセント削減します。

更に、バックアップ電源をラックに近づけ、熱気を排出するために使用するファンの数を減らし、代わりに自然な圧力差を利用することで、サーバーに利用可能な電力量を向上させています。

液冷、ラック設計、制御システム

新しいAIサーバーは現在、1チップあたり850Wもの電力を必要とし、間もなく1kWに達すると予想されており、液冷は今や必須となっています。AWSは、新規および既存のデータセンターで、Direct-to-Chip冷却を使用した「斬新な機械的冷却ソリューション」を開発しました。

AWSは、液冷を必要としない技術もあると指摘し、AWS Tranium2やNvidia GB200 NVL72のようなパワーチップセット向けに、空冷と液冷を「シームレスに統合」できる液冷システムを開発したとのことです。

この冷却ソリューションは、「主要なチップメーカー 」と共同で開発されました。

AWSのグローバルデータセンター担当バイスプレジデントであるKevin Millerは、ラスベガスで開催されたAWS Re:Invent 2024でDCDに対し、新しい冷却ソリューションでは柔軟性が重要な考慮点であると語りました。

「半導体市場を見ると、空冷か液冷というように、チップが必要とするものは非常に急速に発展しています。」

「私たちが必要としていた重要なことの1つは、どのタイミングでどのチップを導入するか、そしていつ前世代のチップから次世代のチップへの移行を完了させるかによって、異なるデータセンターで異なる構成で展開できる柔軟性でした。」

さらに、液冷は以前から存在していたが、「大規模な液冷のサプライチェーンはほとんど開発されていない」と述べました。

AWSはまた、データと生成AIを利用し、データセンター内のラックの最も効率的な配置方法を導き出したほか、電力量を削減したうえでサイトあたり12%増のコンピューティング電力を提供することに成功しました。

この新しいラックの配置は、新しいAIハードウェアと 「他の幅広い種類のハードウェア 」に適用されます。

Kevin Millerはこの構成について、ホール内にはさまざまなラックやハードウェアがあると述べ、同じハードウェアを単に並べるのではなく、冗長性と耐障害性を向上させていると付け加えました。「インフラを全データセンターに分散させているということは、我々が可用性の実績を非常に誇りに思っているということのですが、可用性に影響するイベントが発生した場合、まず最初に行うことのひとつは、どれだけのものが影響を受ける可能性があるのか、その範囲や爆発率を最小限に抑えることです。」

「とはいえ、すべてが空冷から液冷に移行するため、これらのラックをサポートするために液化装置を追加できる柔軟性が必要です。そのため、おそらく特定のデータホールでは、現在よりも液冷ラックに少し偏ることになるでしょう。しかし、最終的にはやはり柔軟性を持たせたいと考えています。」

電力面では、AWSは今後2年間でラックの電力密度を6倍に、将来的にはさらに3倍に高めることを可能にする「エンジニアリング・イノベーション」を開発しました。

このクラウド企業はまた、Amazonが所有する制御システムを機械装置と電気装置全体に展開し、監視、アラーム、操作シーケンスの標準化に役立てています。

機械エネルギー消費量を46%、コンクリートの体積炭素を35%削減

AWSは、データセンター全体の持続可能性を向上させる取り組みも行っています。

同社によると新しい冷却システムにより、MWあたりの水使用量を増やすことなく、ピーク冷却時の機械エネルギー消費量を最大46パーセント削減できるとのことです。同社はこの要因として、新しい片側冷却システム、冷却装置の削減、液冷機能の導入を挙げています。

データセンターの建設に使用されるコンクリート中の炭素は、業界平均と比較して最大35%削減されており、同社は全体的に鉄鋼の使用を削減しています。 Millerは、AWSが使用している鋼鉄は、従来のガス燃焼炉ではなく電気アーク炉から供給されており、AWSの鋼鉄に含まれる体積炭素の削減にさらに貢献していると付け加えました。

最終的に、Amazonのバックアップ発電機は、温室効果ガスの排出を削減するため、再生可能ディーゼルで稼働する予定です。

AnthropicのCompute担当エンジニアであるJames Bradburyは、次のように述べています。「Anthropicが最先端の基盤モデルを開発する中で、安全でパフォーマンスとエネルギー効率の高いインフラへのアクセスは、我々の成功にとって極めて重要です。最先端のデータセンター構築に対するAWSのコミットメントは、私たちが主要なクラウドプロバイダーおよびトレーニングパートナーとしてAWSを選んだ主な理由の1つです。同社の設計改善は、AIモデルを強化し、この分野のイノベーションを推進するために、安全でスケーラブルかつ効率的なインフラを提供する上で、大きな前進を意味します。」

このコンポーネントは、AWSの34のリージョン、108のアベイラビリティゾーン、AWSローカルゾーンを含むその他のサービスを含む、世界中のAWSインフラ全体で拡張できるように構築されています。

コンポーネントのフルセットを備えた新しいデータセンターは、米国で2025年初めに開始される予定で、一部の施設ではすでに新しいサービスが利用されています。

この記事は海外Data Centre Dynamics発の記事をData Center Cafeが日本向けに抄訳したものです。

関連記事一覧

  1. この記事へのコメントはありません。