AWSバージニア州北部リージョンで電源問題による限定的な障害が発生

温度上昇が原因

Amazon Web Services(AWS)のバージニア州北部リージョンは、アベイラビリティゾーン (AZ)の1つで発生した「電源喪失」の影響を受けました。

影響を受けたゾーン(use1-az4)では、太平洋夏時間(PDT)5月7日午後5時25分の時点で問題が発生していたことがAWSのヘルスステータスページに記載されています。その時点でインスタンス上には「障害」が発生していました。

インシデントレポートによると、この電源問題は冷却インシデントに関連していたとのことです。AWSは「単一のデータセンター内で温度が上昇し、一部のケースではAZ内のインスタンスに障害を引き起こした」と説明しています。また、「影響を受けたハードウェア上で稼働しているEC2インスタンスおよびEBSボリュームは、温度上昇したことによる電源喪失の影響を受けている」としています。

AWSは午後8時6分の時点で、「影響を受けたAZ内では冷却システムの復旧作業が段階的に進んでいる」と述べました。ただし、その進捗は「当初の想定よりも遅れている」としていました。

さらに午後10時11分には、「初期的な回復の兆しが見られる」とし、「追加の冷却システム容量を稼働させることができ、一部の影響を受けたラックの復旧が可能になった。現在は制御された安全な手順で、追加ラックの復旧作業を進めている」と説明しました。

一部で改善は見られているものの、執筆時点でもAWSは同リージョンで運用上の問題が継続しているとしています。(訳注:5月8日20:04 PDTにほぼ復旧した旨の報告がAWSより示されました。)

バージニア州北部リージョンは過去にも影響を受けており、2025年10月には大規模障害が発生しました。この際にはPerplexity、Snapchat、Fortnite、Airtable、Canva、Amazon、Slack、Signal、PlayStation、Clash Royale、Brawl Stars、Epic Games Store、Ring Camerasなどがダウンしました。また、同リージョンでは2015年、2017年、2021年にも同様の問題が発生しています。

use1-az4のあるUS-East-1リージョンはAWSで最も古く、最大規模のリージョンです。2006年に開設され、6つのAZを持ちます。それぞれのゾーンは少なくとも1つのデータセンターで構成されていますが、実際にはそれ以上の設備で構成されているとみられます。

一方AWSは現在、中東地域の紛争の影響によりデータセンターが損傷したことで、UAEリージョンでも継続的な問題が発生しています。同社はこのインシデントを受け、顧客に対してBahrainリージョンから他のネットワークへのワークロード移行を推奨しています。

この記事は海外Data Centre Dynamics発の記事をData Center Cafeが日本向けに抄訳したものです。

関連記事一覧

  1. この記事へのコメントはありません。