【OVH火災事故】OVHcloud、SBG1データセンターの再開を断念

OVHcloudは、3月10日のSBG2施設全焼の影響で損傷を受けたストラスブールのSBG1データセンターの再開への取り組みを断念しました。

同社は、先週金曜日夜の2度目の小規模火災により、バッテリー室で煙が発生した事故を受けて、SBG1の再起動は行わないと発表しました。代わりに、同社はSBG1に残るサーバをストラスブールサイトの別棟や他のOVHデータセンターに移設し、他の2棟のデータセンターSBG4とSBG3の再開に全力を尽くします。UPSが原因と想定されている壊滅的な火災事故がSBG2を全焼させ、サイト全体が停止してから10日が経過しました。顧客はデータを失ってしまいますが、OVHcloudは多くを最終的に再構築できることを望んでいます。

OVHcloud、SBG1を見捨てる

「SBG1の再開は永遠にない」OVHcloudの創設者であるOctave Klaba氏はこのようにツイートし、SBG1のサーバがどこに配備されるかについて詳しく説明しました。SBG3とSBG4については再起動が進められています。

SBG1サーバの大部分(61A/Dおよび62A/Dとラベル付けされた約160ラックのサーバ)は、残存のデータセンター2棟のうち小さい方のSBG4に移設されます。61E/62Eというラベルの付いた50ラックのサーバは、RoubaixにあるOVHのCroix施設でクリーンアップが行われ、RoubaixとGravelinesにあるデータセンターで再起動されます。

OVHcloudは、SBG3からSBG4に新しい電源ケーブルを引いています。「SBG4からSBG3への電力を掘り起こし、接続するには3日が必要」とKlaba氏は3月21日にツイートしました。

サイト最大の施設であるSBG3では、60人のエンジニアがサーバのクリーニングと再起動処理を行っています。3月21日の時点で、Klaba氏は、SBG3の仮想プライベートサーバ(VPS)の40%は稼働している、と報告しています。OVHは現在、残りのVPSの再起動に向けて作業を進めています。これには外部のクリーニング専門業者2社が支援を行っています。

ただ、Klaba氏は、プロセスの遅延を警告しています。「最初にネットワークをクリーンアップする。次にラック毎、そして次にサーバのクリーンアップを行う。コントロールプレーン用のPCIサーバとPCCサーバを用意した後の、サーバのクリーンアップは面倒なプロセスです。ソフトウェア上で作業はできるが、復元には時間がかかる。同時に、チームはBM(※編集部注:ベアメタル?)にも取り組んでいる」

バックアップは無料に

火災の翌日、Klaba氏は、SBG2内のUPS7が前日にサプライヤーからのメンテナンスを受けており、そして火災発生から数時間後に消防士が現場に到着した際、UPS7とUPS8の両方が炎上していたという事実を明らかにしました。これは、UPSシステムが火災に関与したことを強く示唆していますが、原因に関する明確な情報が得られる前に、警察とOVHの保険会社が進めている調査を完了する必要があります。UPSシステム、バッテリー、ヒューズなどは調査員に引き渡されています。

先週金曜日夜、接続されていないバッテリーを収容するSBG1の部屋で煙が上がっているのが発見されました。直ちに消防士が出動し、すぐに状況をコントロールしました。幸い、先週金曜日、そして3月10日の最初の火災事故共負傷者はいませんでした。

各ユーザーがデータの復元可否の確認を待つ間、Klaba氏は今後全てのサービスに無料のバックアップを含むと約束しました。理由はユーザーは信頼性のレベルを理解せずにクラウドサービスに依存しているためであるとし、「いくつかの顧客は何を契約したかについてさえ正確に把握していない」とKlaba氏は先週話していました。

Data Center Dynamics

原文はこちら

関連記事一覧

  1. この記事へのコメントはありません。