Fastly、グローバル大規模障害は顧客が引き起こしたソフトウェアバグが原因と発表、株価は急上昇

昨夜インターネットの大部分を停止させたFastlyの世界的な大規模障害は、顧客の設定変更によって引き起こされたソフトウェアのバグが原因とされています。

6月8日に発生したこの障害で、Amazon.com、Twitch、Reddit、英国政府のウェブサイト・ポートフォリオなど、多くのサイトやサービスが停止しました。(※日本の数多くのサイトも影響を受けたと報告されています)

Fastlyは、1分で問題を特定し、49分以内にネットワークの95%を復旧させたと述べています。しかし、一部のユーザー環境では、オリジンサーバーの負荷が増大し、キャッシュヒット率が低下したため、より長時間の停止となりました。

コンテンツデリバリネットワーク(CDN)を手掛けるFastlyは、企業のデータセンターとエンドユーザー間でエッジクラウドを運用し、レイテンシーの削減、DDoS攻撃からの保護、トラフィック急増への対応を支援しています。

コンテンツダウンタイムネットワーク

Fastlyは、顧客が無効化できるバージョンのソフトウェアを導入したことで、うっかりシステムにブービートラップを仕込んでしまったようです。エンジニアリングおよびインフラストラクチャー担当SVPのニック・ロックウェル氏は、解説記事の中で次のように述べています。「5月12日、我々は、特定の状況下で特定の顧客の設定によって引き起こされる可能性のあるバグを持つソフトウェアの展開を開始した」

「6月8日未明、顧客がバグを引き起こす特定の状況下において変更を行ったところ、当社のネットワークの85%がエラーを起こしてしまった」

障害はUTC9:47(日本時間18:47) に発生しましたが、10:36(日本時間19:36) 頃からサービスは回復し始めました。12:35(日本時間21:35) には完全に収束し、17:25(日本時間26:25) にはバグの修正プログラムの配布が開始されました。

ロックウェル氏は、「私たちは、今回の事故を受けて行ったプロセスと実践について、完全な事後検証を行っている」と話しています。「ソフトウェアの品質保証とテストの過程で、なぜバグを検出できなかったのかを解明していく」

ロックウェル氏は、この問題を「予測すべきだった」と述べ、Fastlyの顧客に謝罪を述べています。

しかし、投資家らには動揺が見られませんでした。むしろ逆効果で、Fastlyの株価は急上昇しました。障害が注目を集めたためか、あるいはFastlyの利用顧客数の多さが明らかになったためではないかと思われます。競合であるAmazonも、独自のCDNであるCloudFrontをFastlyの利用顧客であるとしています。

本稿執筆時点で、Fastlyの株価は約10%上昇し、評価額は6億ドル弱に達しています。障害関連で急上昇する前は、同社の株価は着実に下落しており、年初から今日までに42%の下落を記録していました。

この下落の一因は、成長株に対する一般的な投資家心理の冷え込みによるものでしたが、5月に発表されたCFOの退任により、さらにそれは悪化していました。

Data Center Dynamics

原文はこちら

関連記事一覧

  1. この記事へのコメントはありません。