Microsoft障害、Azure、Office365、Teamsなど停止

設定変更が混乱を引き起こした

システムアップグレード処理の失敗に起因し、米国時間の月曜日夜間の3時間にわたり、一部のユーザがMicrosoft Office 365、Teams、Outlook他へのログインができなくなるといった障害が発生しました。

具体的には、UTC 21:25からUTC 00:23の間、Microsoft Azure Active Directory(Azure AD)が停止し、それが認証サービスに影響を与え、ユーザログインができなくなったということです。 マイクロソフトは、この障害は最近実施した「設定変更」が原因であったと説明しています。 その変更をロールバックする事で、UTC 2:30頃までには多くのユーザは通常どおりサービスを使用できるようになるはずだと報告しています。

Azureアウト

世界的な停止の報告であるにもかかわらず、マイクロソフトのステータスレポート上では、停止の影響を受けたのは「一部のAzure PublicおよびAzure Governmentクラウド利用顧客」であるとしています。尚、既にログインできているユーザは、作業を続けることができるようです。
マイクロソフトの予備分析では、原因は直近の設定変更であるとされ、これがバックエンドストレージレイヤに影響を与え、認証要求に「遅延」を引き起こしたとしています。これに応じて、同社は変更のロールバックを実施しました。しかし、一部のユーザは数時間程度、影響の残りを感じることがあるようです。

心配なことに、米国では同じ時間帯に911緊急通報サービスの中断にも見舞われました。 14の州でこの問題が発生し、ワシントン州 レドモンド市のツイートでは、Microsoftクラウドの問題を非難する人もいました。ZDNetは、緊急通話の障害の原因として最も可能性が高いのは、Voice over IP(VoIP)で動作するPSAP(Public Safety Answering Points)の問題であると報告しています。

初期の報告の後、すべては順調に見えます。セキュリティの専門家であるマイク・ファウラー氏は、クラウドでは障害発生の可能性は低くなるが、一旦障害が発生すると複数の顧客に影響を与えるため、結果的に影響は大きくなっている、とツイート上で指摘しています。

マイクロソフトは、完全なポストインシデントレポート(PIR)を72時間以内に公開すると約束しています。

Data Center Dynamics

原文はこちら

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください