AWS東京リージョンで発生した障害について(4.20)

Amazon Web Service(AWS)の東京 リージョン ( AP-NORTHEAST-1 )において20日の19時ごろから大規模障害が発生した模様です。 尚、23:09PM JST時点ではすべての障害は解決し、現在では正常稼働に戻ったようです。

AWSのステータスページ上では、影響を受けたサービスとして、 CloudWatch 、 Simple Queue Service 、 CloudFormation 、及び Lambda がリストされています。

ステータスページの詳細には、「いくつかのアラームの処理においての レイテンシ 増加」 、「送信および受信操作におけるエラーレートの上昇」「書き込みコントロールプレーンAPIのエラー率の増加」などが報告されていましたが、原因についてはまだ不明です。

また、DownDetector上では、10:35PM頃から12:05AM頃までにTwitterの障害も報告されていました。これがAWSの今回の障害と関係しているかは現時点で確認できていません。他にも同じ時間帯にいくつかの障害がネット上で報告されています。

DownDetector

AWSの東京リージョンは、2019年8月23日にも大規模障害を起こしており、その際の障害発生原因は、「一部の冗長化された冷却制御システムシステムのバグが、冷却装置の誤作動を引き起こし、データセンター内の温度上昇が発生したため、サーバーが過熱しシステムの障害が発生した」としていました。

(DC ASIAにて原文一部引用、及び加筆)