CloudflareのDNSが停止し多数のサービスに影響

Feedly, Tumblr, Discordなどに影響。 DDoS攻撃が原因ではないとの同社声明

金曜日の夜、CloudflareのDNSが停止した影響で多数のサービスが停止しました。同社はこの障害は12か所の データセンター に影響を与えたとコメントしています。

DNSの主な問題は修復されましたが、一部のサイトは依然として連鎖反応による障害が続いているようです。

悪いルート

「今日の午後、ネットワークの一部で停止が発生した。」とCloudflareは30分以上続いた障害について説明しました。

「グローバルバックボーン上のルータが悪いルートを通知し、ネットワークの一部が利用できなくなったようだ。根本原因は修復できると信じている、また現在システムの安定性を監視している。」

同社は、この障害はDDoS攻撃によるものではないと強調しています。これは、先日のT-Mobileの停止時にもあったように、大規模停止が発生するたびに発表される一般的なセオリーです。

「影響を受けたデータセンターは、SJC、DFW、SEA、LAX、ORD、IAD、EWR、ATL、LHR、AMS、FRA、CDGです。」

Tumblr、Discord、Feedly、Politico、Shopify、League of LegendsなどのWebサイトやサービスは、他の数えきれないサービスとともにダウンしました。GoogleのDNSサービスも同時間帯に問題があったように見えましたが、これに関連しているかどうかは不明です。

CEOのマシュー・プリンス氏は、今回の障害はアトランタのデータセンターから始まったと述べています。「アトランタのルータを分離してバックボーンをシャットダウンし、代わりにトランジットプロバイダーにトラフィックをルーティングした。輻輳が発生したため、一部のリンクでログが多発しパフォーマンスが低下した。現在すべての問題は復旧し、根本原因を調査中です。 」

プリンス氏は昨年発生した大規模障害の後、DCD に次のように語っていました。「我々はCloudflareで、より良いインターネット環境の構築を支援する使命を持っていた。しかし、それに応えることができなかった。私が個人的にその責任を負う。そしてこの事実に非常に失望し、辛いことだ。」実は、この時、別のCloudflare障害のわずか1週間後に停止が再発し、インターネットの大部分に対するクロールを引き起こしていました。

「今回の障害の朗報は、弊社が完全にコントロールできているという点です。したがい、修復できることがわかっており、安全策を講じることができ、そして再発はしません。「我々は常に失敗を犯しているが、いつも違う失敗を犯している。これは、健全な組織の兆候であると思う。」

Data Center Dynamics

原文はこちら

関連記事一覧

  • コメント ( 0 )

  • トラックバックは利用できません。

  1. この記事へのコメントはありません。