AWS東京リージョン障害は5時間で復旧

昨日2月19日夜間から20日未明にかけてAWS東京リージョンの単一アベイラビリティゾーン(apne1-az1)で発生した障害は20日の早朝にはおおむね復旧した模様ですが、気象庁を始めとした、AWSを利用する一部ユーザのサービスにはしばらく影響が残ったようです。

今回の障害は冷却装置の電源損失に伴い、サーバールーム内の室温上昇したことで、EC2インスタンスの一部がダウンしたことが原因とされています。

AWSの東京リージョンでは、2019年8月にも、冷却装置の誤作動に伴い、データセンター内の温度上昇を原因とする今回と同様の原因によるデータセンターの大規模障害を引き起こしています。

2019年8月23日金曜日に発生したAWS東京リージョン(AP-Northeast-1)大規模障害に関する概要

AWSは1 つ以上の データセンター で構成される「 アベイラビリティゾーン (AZ)」 を設け、仮に一か所のデータセンターが停止しても、ほかのデータセンターがバックアップ動作を行えるよう レジリエンス 力を確保しています。同一 リージョン 内に属する複数のAZはそれぞれが冗長光ファイバで接続され、各AZはそれぞれ独立した電力・冷却設備を備え、冗長化構成が組まれています。

それでも、今回のように、システムの構成によっては、データセンター障害の影響を受けてしまうことがあります。影響を受けないようにするには、ユーザーはシステムを、単一AZではなく、マルチAZ、あるいはマルチリージョン範囲での設計が必要となるでしょう。

関連記事一覧

  • コメント ( 0 )

  • トラックバックは利用できません。

  1. この記事へのコメントはありません。