Microsoft Azure障害とCrowdStrikeの欠陥アップデートのその後は?

先週、Microsoft Azureの障害とCrowdStrikeのアップデートの不具合が、世界各地の交通機関や、銀行サービスに2つの打撃を与えました。いくつかの航空会社ではチェックイン手続きに支障をきたし、列車の遅延も発生しました。一方、銀行アプリや、オンライン取引も影響を受けました。

Microsoft Azureは、巨大企業のクラウドコンピューティングプラットフォームである一方、 CrowdStrikeはフォーチュン500のグローバル企業のうち、298社を顧客とするサイバーセキュリティ企業です。

発生原因

Microsoft Azureによると、「2024年7月18日21:56UTCから19日12:15UTCの間、米国中部地域の複数のAzureサービスにおいて、サービス管理業務や接続性、サービスの可用性に関する障害を含む問題が発生した可能性があります。」障害の原因について同社は、「ストレージの事故が仮想マシンの可用性に影響を与え、予期せず再起動した可能性があります。影響を受けた仮想マシンとストレージリソースに依存するサービスにも 影響が及ぶ可能性があります」と説明しています。

問題の解決には数時間を要しましたが、問題はCrowdStrikeでほぼ同時に発生した問題によってさらに深刻化しました。多くのマイクロソフトユーザーが、「死のブルースクリーン」と呼ばれるエラー画面に見舞われました。

CrowdStrikeは公式ブログで、「2024年7月19日04:09(UTC)、継続的な運用の一環として、当社は、Windowsシステム向けにセンサー設定のアップデートをリリースしました」と説明しています。さらに同社は「センサー設定のアップデートは、Falconプラットフォームの保護メカニズムの継続的な部分です。この設定アップデートは、影響を受けたシステム上でシステムクラッシュと、ブルースクリーン(BSOD)を引き起こすロジックエラーを引き起こしました」と述べています。

CrowdStrikeの創設者兼CEOはさらに声明を発表し、「今回の障害は、Windowsホスト向けのFalconの、コンテンツアップデートで見つかった欠陥が原因です。MacとLinuxホストには影響はありません。これはサイバー攻撃ではありませんでした。」

マイクロソフトのサティア・ナデラ最高経営責任者(CEO)もX(旧ツイッター)で、「昨日、CrowdStrikeがアップデートをリリースし、世界中のITシステムに影響が出始めました。我々はこの問題を認識しており、CrowdStrikeや業界全体と緊密に協力し、システムを安全にオンラインに戻すための技術的なガイダンスとサポートを顧客に提供しています」と述べました。

世界への影響

オーストラリアからアメリカ、日本からインドに至るまで運行障害が報告されました。CNNは、航空会社の追跡・データプラットフォームであるFlightAwareを引用し、金曜日の夕方現在、運行に支障をきたしているフライトの数はおよそ3,000便にのぼると報じており、また、11,000便以上が遅延しているようです。影響を受けた航空会社には、アメリカン航空、デルタ航空、ユナイテッド航空などがあります。

ロンドンのスタンステッド空港と、ガトウィック空港では遅延が報告され、アムステルダム、ニューデリー、東京の空港でもサービスに影響が出ました。Hindustan Timesによると、インドのいくつかの空港では、危機を緩和するために、空港が手動で搭乗券を発行したり、ホワイトボードにフライトの最新情報を書き込んだりしたとのことです。

航空サービスはオーストラリアでも影響を受け、銀行、スーパーマーケット、メディア企業も影響を受けました。ABCニュースは、停電が銀行や決済システムに打撃を与え、一部のスーパーマーケットやガソリンスタンドが閉店を余儀なくされたと報じました。

英国紙Guardianは、最大の通勤鉄道ネットワークであるGTRは、ThameslinkとSouthernの列車が通信システムの故障で運行不能になり、South Western鉄道の切符自動販売機も動かなくなったと報じました。

医療サービスは、カナダ、ドイツ、イスラエル、オランダ、イギリス、アメリカの多くの地域で中断していると報じられています。オーストラリア、フランス、英国ではメディアサービスに影響が出ており、一部のTVニュースチャンネルは一時的に放送を停止したり、画像や天気図を表示できなくなったりました。

現在の状況は?

Azureの障害に関して、マイクロソフトは調査の結果、「バックエンドのクラスタ管理ワークフローが、Azure Storageクラスタのサブセットと、米国中部のコンピュートリソースの間でバックエンドのアクセスを、ブロックする原因となる設定変更を導入したと判断しました。この結果、影響を受けたストレージリソース上でホストされている仮想ディスクへの接続が失われると、コンピュートリソースが自動的に再起動することになりました」と説明しています。

一方、CrowdStrikeによると、システムクラッシュの原因となったセンサー設定の更新は、2024年7月19日(金)05:27 UTCに修復されたとのことです。

しかしマイクロソフトは、この誤ったアップデートが数百万台のデバイスに影響を与えたと推定しています。同社はブログの中で、「我々は現在、Crowdstrikeのアップデートが、850万台のWindowsデバイスに影響を与えたと推定しており、これは全Windowsマシンの1%未満です。この割合は小さいものの、広範な経済的・社会的影響は、多くの重要なサービスを運営する企業がCrowdStrikeを使用していることを反映しています」 と述べています。

両方の危機は一見解決したように見えますが、2つの機能停止による経済的影響はまだ確定していません。大企業や銀行への影響は明らかですが、中小企業、中堅・零細企業、個人の専門サービス・プロバイダーが被った経済的損失を把握するのはさらに困難です。

専門家の中には、損失総額は10億米ドル近くになると指摘する者もいます。ミシガン州の調査会社Anderson Economic GroupのCEOであるPatrick Anderson氏は、ストライキやその他の事業中断のような出来事の経済的コストの見積もりを専門としており、CNNの取材に対し、損失額は10億米ドルを軽く超えるだろうと語りました。

一方、CrowdStrikeの株価は危機の余波で急落しました。Investopediaによると、金曜日にCrowdStrikeの株価は11.1%急落し、S&P500銘柄の中で最も大きな損失を記録しました。

W.Media ( Deborah Grey 記者)より抄訳・転載

画像に alt 属性が指定されていません。ファイル名: image.jpeg


関連記事一覧

  • コメント ( 0 )

  • トラックバックは利用できません。

  1. この記事へのコメントはありません。