
RailwayがClaudeを活用してデータセンターを設計
自社の「第2世代」サイトの展開を支援
Platform-as-a-Service(PaaS)を提供するRailwayは、自社データセンターの導入設計にAIを活用しています。
最近のブログ投稿で、自社の「第2世代」サイトの構築設計にAnthropicのClaudeを利用していることを明らかにしました。
Claudeは、4つの地域にわたる8か9の異なるデータセンターの展開を計画しました。これには、「約6社のサプライヤー、数十社のネットワークプロバイダー、数十人の技術者、数百の部品点数、数千本のケーブル、そして大量のマジックテープ」が含まれていました。
同社によると、これらの構築・セットアップは、2〜3週間の設置期間でを完了させる必要がありました。
現在Railwayは、Google Cloud(GC)、Amazon Web Services(AWS)、およびデータセンターに配置された自社のベアメタルサーバーを組み合わせて運用しています。
同社が最初にベアメタルサーバーを展開した際、第1世代サイトを18か月かけて8段階に分けて導入しました。「各リージョンに、まずサイトのスケルトン(骨組み)を構築し、約20%の容量を埋めたところで数か月間別の作業を行い、その後、次のサイトで同じことを繰り返していました。最初のスケルトンから、サイト容量の15〜20%単位でコピー&ペーストのようなスケールアップを実行し、徐々に埋めていきました。」
しかし、需要の増加や、「DRAMから光ファイバーに至るまで」あらゆる資材に対する膨大な需要によるサプライチェーン問題といった業界的制約により、この方法では十分に迅速とは言えませんでした。
RailwayはClaudeに対し、従うべき「フレームワーク」を与えました。これには、変更の追跡、適用、検証を意味する物理インフラのバージョン管理、デバイス、ケーブル、ラック、サイトが要件を満たしているか検証するための設計ルールチェック(DR)、部品ライブラリ、属性および制約システムが含まれています。
さらに同社は、社内のDCIMをリアルタイム化し、作業プロセスを記録するスキルを持つ厳選されたMCP(Model Context Protocol)ツール群も追加しました。
実際の構築については、同社が展開している各地域にチームを持つグローバル請負業者を起用しました。
ハードウェア仕様に関しては、第2世代は「最新世代のAMD Zen 5c EYPC CPU(96コア/192スレッド)とDDR5、第1世代の5倍のストレージ、デュアル100G ConnectX-6 NIC」で構成されています。また、第1世代のストレージサーバーと同じシャーシに収められており、SKU(最小管理単位)を4から2へ削減しています。
Railwayはさらに、各第2世代サイトは「第1世代サイトの上に構築するのではなく、隣接して建設されています」と説明しています。これにより「自社のダークファイバーで両建物を接続することが可能になりました。具体的には、4つの異なる経路にまたがる400Gbpsのリンクであり、より多くの波長が必要な場所にはDWDM(高密度波長分割多重)を採用しています。また、ほとんどのリージョンにおいて、最寄りのハイパースケーラーのリージョンへ1ミリ秒未満で到達できます。これは、AWSやGCPに片足を残している当社のエンタープライズ(法人)顧客にとって重要なことです。」
6月初旬時点で、第2世代は4つのリージョンのうち米国西部(カリフォルニア)、米国東部(バージニア)、オランダのアムステルダムの3地域で稼働しています。残るリージョンはシンガポールです。
Railwayは当初Google Cloud Platform上で構築されていましたが、以前、これには価格設定への影響を含め、「当社の事業存続を脅かすほどの数多くの問題」が伴い、上流で何が原因で障害が発生しているのかを会社が把握できるケースが「極めて稀」であると述べていました。同社は以前、次のように記しています。「年間数百万ドルを費やしているにもかかわらず、Googleから得られるサポートは、100ドルを支払った場合とほぼ同じ程度です。」
注目すべき点として、最近RailwayはGoogleが同社のプロジェクトの1つを停止した事態があります。その際Googleとの間で問題が発生しましたが、事情に詳しい関係者がDCDに話したところによると、これはGoogle Cloudが利用規約に違反する暗号資産マイニングの急増を検知したため、行われた措置だったようです。
情報提供者によると、通常の手順に従って複数の顧客アカウントが停止されたとのことです。しかし特にRailwayのアカウントについては、同社のプラットフォーム上で発生している不正・悪用行為への対応を何年にもわたって怠ってきた経緯があるとしています。
RailwayとGoogle Cloudの間でのやり取りは比較的迅速に行われましたが、正式なサポートチケットは提出されませんでした。
この記事は海外Data Centre Dynamics発の記事をData Center Cafeが日本向けに抄訳したものです。
















この記事へのコメントはありません。