Googleサービスが米国で30分間停止

今週木曜日、米国東部時間の午後9時30分頃、 Googleでサーバープールがクラッシュするという障害が発生し、この影響でGmail、YouTube、Googleドライブ、Google検索などのGoogleのコンシューマ向けサービスが30分間停止しました。 また、パンデミックに伴いオンライン教育で幅広く利用されているサービスGoogleClassroomも停止しました。

しかし、同社のクラウド基盤は、一部のAPIに影響を与えただけで、稼働は維持しました。

Routing Server(ルーティングサーバー)が、routed(総崩れ)、Googleはroot cause(根本原因)をroot out(根絶)する必要がある

「トラフィックをアプリケーションバックエンドにルーティングするサーバープールがクラッシュし、その特定のプールに関連するユーザが影響を受けた」と、Googleのインフラストラクチャ部門責任者のUrs Hölzle氏はツイートしています。

「今回の停止を謝罪します。これらのサービスがあらゆる人々の生活にとってどれほど重要であるかを私たちは理解しています。このような障害が二度と起こらないように、事後検証を行っています」と彼は付け加えました。

そのような事後検証を行ってきたにも関わらず、今回のような障害は全く特別なものではありません。今年だけでも、3月に2度4月にも1度、更に8月にも1度と大規模障害を含め、Googleはいくつもの停止を起こしています。

また、牛がGoogleの停止を引き起こした事件(5月)もありました。幸いこれは大規模障害に発展する前に解決されました。

Data Center Dynamics

原文はこちら