エクイニクスLD8データセンターで大規模障害が発生

UPS障害がネットワーク障害を誘発

本日エクイニクスのDocklands IBX LD8で発生した停電事故に伴い、重大なネットワーク障害が発生しています。

この障害は早朝(英国夏時間:BST)に始まり 、執筆時点(BST午後12時14分)でも進行中の状況です。

L8 Reply(遅い報告)

「本日、英国ロンドンDocklandsのエクイニクスIBX LD8で、停電事故が発生しました。この事故は、その施設を利用している顧客に影響を与えました。停電は、顧客のネットワークサービスにも影響を与えた可能性があります」 エクイニクスは 、障害発生後8時間経った12:04pm BSTに最初の公式声明を出しました。

「エクイニクスのエンジニアは、障害の根本原因を UPS (無停電電源装置)システムの故障であると診断し、お客様と協力して影響を最小限に抑えるよう対処しています。この障害に伴うご不便をお詫びします」

「このインシデントに伴い、必須の体温検査やマスク着用などのCovid-19制限に対し、より柔軟なアクセスをお客様に許可します。スタッフとお客様の安全は私たちの最優先事項です」

停電事故に巻き込まれたのはGiganetで、同社の障害報告ページ上では詳細情報が提供されています。

「4:23am頃に、Equinix LD8での弊社2ラックのうちの1ラックでA・B系双方の電源を失った」と同社は述べています。

「これはUPSの障害に続いて起こり、そしてエクイニクスは、 データセンター で火災警報が作動したと報告があった。電源を失ったラックにはコアのJuniper MXルータやCisco LNSが搭載されていた。 Juniper MXルータは、LD8の全てを機能させるために必要だった。これには、数多くの専用線接続の終端や、我々のvDCプラットフォームへの接続を提供していた。弊社の全ての機器の電源は、データセンターから提供される「多様な」A + B電源により冗長給電されていた。しかし、今回の事故を受け、我々は レジリエンス 性の欠如を疑い、またこの重要箇所の停電は明らかに受け入れられない為、事件の収束後、確実に問題提議を行っていく」

停止の規模が非常に大きいため、他のデータセンターでも問題が発生しているようだ、ともGiganetは述べています。「このインシデントはEquinix LD8に影響を及ぼしているが、専用回線とブロードバンド回線は他のデータセンターTelehouse Northで終端しており、さまざまなタイミングで断続的なパケットロスや遅延の増加の兆候が見られている」

「この停止の規模、そして通信キャリア・サプライヤが受けた影響を考えると、通信キャリアのエコシステム・ネットワーク周りで連鎖反応の影響が発生するかもしれないと我々は推測している」

同社は次のように補足しています。「ロンドン・インターネット・エクスチェンジ(LINX)では現在、150社がこの停止の影響を受けており、この停止のスケール感を報告している」

Epsilon、SiPalto、EX Networks、Fast2Host、ICUK.net、およびEvoke Telecomらは、SNS上でサービス停止を顧客に謝罪しました。BTも影響を受けたと考えられていますが、コメント要求には応じていません。

以前2016年にTelecityデータセンターで発生した停止もUPSの問題(原因詳細非公開)が原因でした。「これは限られた顧客にのみ影響を与え、サービスは数分以内に復旧した」とEquinix UKのMD Russell Poole氏は当時このように述べていました。

「残念なことに、復旧への想定時間はまだ案内されていない、これが最もイライラする 」とGiganetは最新のアップデートでコメントしています。「エクイニクスには継続的にアップデートを要求している」

Data Center Dynamics

原文はこちら