2024年のIT障害は発生頻度・深刻度ともに減少したが、コストは増加

電力が依然として障害の主な原因

IT障害の頻度や深刻さは減少していますが、コストは高くなっています。

このことは、定額制リサーチサービスのUptime Intelligenceが発表した、2024年の世界でのIT障害に関する新しいレポートで発表されました。同レポートは、ITインフラに特化したアドバイザリー事業を展開するUptime Instituteの下で運営されています。

53%の事業者が2021年から2024年にかけて障害が発生したと報告し、これは過去3年間よりも低い割合です。

停電の深刻度も低下しています。Uptime Intelligenceの5つの障害カテゴリのうち、調査対象となった768の事業者の76%が、障害は「最小限」または「無視できる程度」しか経験していないと回答しました。残りの24%の事業者は、「重大」、「深刻」、「きわめて深刻」な停止を経験しており、そのうち3%は「きわめて深刻」であったと回答しています。

Uptimeは、これは「リスク管理と信頼性における業界の進歩」によるもので、業界全体の成長と歩調を合わせているとしています。

しかし、発生した障害のコストはより高額になっています。調査対象となった91の事業者のうち、回答者の54%が、直近の重大な障害の総費用が10万ドルを超えたと答えました。障害の20%は100万ドル以上かかり、前年比(YoY)で4%増加しました。

Uptime Instituteは、この原因について、デジタルサービスの重要性が増していること、インフレ、人件費やハードウェアの交換コストの上昇、サービスレベル契約の違約金、復旧時間の長期化などを挙げています。

電力関連の問題は、引き続き影響力の大きい障害の主な原因となっています。調査対象となった97の事業者のうち、54%が障害の主な原因を電力としました。続く冷却が13%、3位はネットワーク関連で12%でした。

一方、412人のオペレーターに最も一般的な障害の原因を尋ねたところ、ITとネットワークが全体の53%を占めました。Uptime Instituteは、この原因を「ITとネットワークの複雑化が、変更管理や設定ミスの問題につながっている」と分析しています。

ヒューマンエラーもより大きな懸念となりつつあります。この報告書では、人為的ミスは傷害の根本的な原因ではなく、その一因として扱われており、そのため単独で分析されています。調査対象となった397人のオペレーターのうち58%が、ヒューマンエラーのカテゴリの中で、ほとんどの問題はデータセンターのスタッフが手順に従わなかったことに起因すると回答しました。これは前年比10%の増加です。

同報告書はまた、既存の冗長化対策を補完する「ソフトウェアベースおよび分散型のレジリエンシーツール」の利用が拡大しているとも述べています。しかし、ソフトウェアへの移行は、障害の根本的な原因を分類・分析することをより困難にしているとのことです。

Uptime Intelligenceのエグゼクティブ・ディレクターであるAndy Lawrenceは、次のように述べています。「全体的に障害の発生は減少しています。データセンター事業者は、送電網の制約、異常気象、ネットワークプロバイダーの障害、サードパーティ製ソフトウェアの問題など、制御不能な外部リスクの増大に直面していますが、より不安定なリスク環境にもかかわらず、改善が進んでいます。」

この記事は海外Data Centre Dynamics発の記事をData Center Cafeが日本向けに抄訳したものです。

関連記事一覧

  1. この記事へのコメントはありません。