AWS東京リージョン障害は5時間で復旧
昨日2月19日夜間から20日未明にかけてAWS東京リージョンの単一アベイラビリティゾーン(apne1-az1)で発生した障害は20日の早朝にはおおむね復旧した模様ですが、気象庁を始めとした、AWSを利用する一部ユーザのサービスにはしばらく影響が残ったようです。
今回の障害は冷却装置の電源損失に伴い、サーバールーム内の室温上昇したことで、EC2インスタンスの一部がダウンしたことが原因とされています。
AWSの東京リージョンでは、2019年8月にも、冷却装置の誤作動に伴い、データセンター内の温度上昇を原因とする今回と同様の原因によるデータセンターの大規模障害を引き起こしています。
2019年8月23日金曜日に発生したAWS東京リージョン(AP-Northeast-1)大規模障害に関する概要
AWSは1 つ以上の データセンター で構成される「 アベイラビリティゾーン (AZ)」 を設け、仮に一か所のデータセンターが停止しても、ほかのデータセンターがバックアップ動作を行えるよう レジリエンス 力を確保しています。同一 リージョン 内に属する複数のAZはそれぞれが冗長光ファイバで接続され、各AZはそれぞれ独立した電力・冷却設備を備え、冗長化構成が組まれています。
それでも、今回のように、システムの構成によっては、データセンター障害の影響を受けてしまうことがあります。影響を受けないようにするには、ユーザーはシステムを、単一AZではなく、マルチAZ、あるいはマルチリージョン範囲での設計が必要となるでしょう。
コメント ( 0 )
トラックバックは利用できません。
この記事へのコメントはありません。