Google Cloudが再びダウン、今度はGmail他に影響

この数週間で3度目のダウン

4月8日、Google Cloudツールが短時間停止し、Gmail、Snapchat、そしてNest(スマートホーム)関連のサービスで不具合が発生しました。

Cloud Identity and Access Management(IAM)のAPIで90分弱の障害が発生し、App Engine、Cloud Functions、Cloud Run、Dataproc、Cloud Logging、Firebase Console、Cloud Build、Cloud Pub /Sub、BigQuery、Compute Engine、Cloud Tasks、Cloud Memorystore、Firebase Test Lab、Firebase Hosting、Cloud Networking、Cloud Data Fusion、Cloud Kubernetes Engine、Cloud Composer、Cloud SQL、Firebase Realtime Databaseに影響が出ました。

IAMダウン

障害は07:35(米国太平洋標準時)に発生し、08:57に回復しました。その間、クラウド利用ユーザはクラウド機能の利用やメタデータタグの取得に不具合が生じました。

障害の中でも特に、今回の停止はGmailのメール配信の失敗、1時間以上のSnapchatの停止、および一部のNestカメラの一時的な映像記録エラーを引き起こしました。

「内部調査の完了次第、このインシデントの分析を公開する。」とGoogleはステータスページ上でコメントしていました。 「障害復旧作業の間、しばらくお待ちください。」

進行中の新型コロナウイルス感染症(Covid-19)のパンデミックが、業務や娯楽をオンライン上に集中させた、この前例のない需要に、今回の障害が関連したかどうかは明らかではありません。

– shutterstock

今回の障害は、Google Cloudでエラー率が7時間以上継続した別の障害が発生してわずか1週間も経たないうちでの発生となります。

3月27日に、G Suiteサービスは、1時間以上にわたり米国東海岸に対し重大な問題を引き起こしました。これにより、Gmail、ハングアウト、ドライブ、ドキュメント、スプレッドシート、スライド、カレンダーが影響を受けています。

「米国南東部にある当社のデータセンターの1つで重大なルータ障害が発生し、ネットワークの輻輳が発生したため、一部のユーザがサービス停止に陥った。」とGoogleはその際に発表していました。

「その結果、そのデータセンターで実行されていたGoogleサービスが直接影響を受け、エンジニアがトラフィックを再ルーティングし、当該サービスを別の施設に移管するまで利用することはできなかった。」

Googleのテクニカル・インフラストラクチャ部門のSVP、Urs Hölzle氏はTwitter上で、停止は新型コロナ(Covid-19)とは関係がなく、「アトランタDCで発生した今回の障害はサードパーティ製ルータのソフトウェアのバグであり、それが複数のルータに影響を及ぼし、同時にすべてがクラッシュしてしまった。」 と説明していました。

Data Center Dynamics

原文はこちら