【特集記事】クラウド時代のインフラエンジニアに必要なもの
物理インフラを知らないエンジニアが増えている?
さて、近年のクラウドの普及 により、 身近にあった物理インフラがクラウド上に置かれ、既にITベンダーやユーザー企業内ではハードウエアやOSや 実際の物理インフラを知らないインフラエンジニアが現れつつあるようです。
特に若手のエンジニアはクラウド関連の技術には詳しいが、 実際のサーバーを触った経験がない人もいるようで、企業のIT部門の一つの課題になっているようです。
しかも驚くべきことに、中にはサーバーやネットワーク機器を触ったことがないばかりか、そもそもそれがどのような形状や構成であるかすら知らないエンジニアもいるようです。
また、実際にデータセンターに立ち入った事がないエンジニアの人も多いと思います。
従来のインフラエンジニアの業務範囲は、社内ITネットワークインフラの基盤全体の設計・構築・運用保守でした。
例えば、ネットワークやサーバー・ストレージのハードウェア構築及び管理、OSやミドルウェアの設定、更にはそれらITインフラデバイス間のネットワーク配線、そして、それら重要なインフラを正常に稼働・維持する為に小型 UPS で電源の冗長化構成を組んだり、更にはセキュリティ管理やサーバールーム内の温度環境の適切な維持等、非常に多くの作業を強いられていました。
このように、従来のインフラエンジニアは日常の運用の中で、IT基盤の設計・構築から非常に多岐に渡る領域のトラブル対応までをこなしてきました。これは、サーバー上で動作するミドルウェアやアプリケーションの管理・運用だけではなく、サーバーのハードウェア・OS障害やネットワークの障害、あるいは場合によっては、物理的なケーブリング配線のエラーや、電源や環境に起因した障害対応なども含んでいました。
現在、これらの「厄介な」インフラ設備がクラウド上に置かれたことで、インフラエンジニアを悩ませていた問題からは解放されました。
しかし、業務の100%全てがクラウド環境上でのシステム構築・拡張やメンテナンス業務になっていれば良いのですが、実際にはそうではありません。企業のクラウド化はまだ2割程度と道半ばであり、クラウド化が進んでいくであろう今後においても、オンプレミス環境は必ず残っていくと思われます。
フルスタックな知識を持つことの重要性
では、実際どのような問題があるのでしょうか?
まず、一つ目の問題として、何らかの障害に遭遇した時の対応力に影響が出てきます。
もし物理インフラにまつわる様々なアーキテクチャや基本理論、物理構成などを理解していないと、 仮にクラウド環境上で 障害が発生した場合の切り分けや対処を行う上で、何が根本原因であるのか?を把握する必要がありますが、勘所がつかめず、より迅速な対処ができない可能性があります。もちろん勘所には、過去実際にトラブルシュートで積んだ現場での苦い経験がある程度必要ではあるので、それを今から経験積むのは難しいですが、最低限の基本理論は理解しておくべきです。
クラウド上で障害が発生した際の原因特定は、オンプレミスと違いサービスを利用している企業ではできません。もちろんクラウド事業者からの障害アナウンスはありますが、障害についてのあれこれを解説はしません。よって、企業側には状況に応じた臨機応変な対応が必要になります。
それにはやはり、ベーシックな知識が必要です。
例えば、ネットワーク上のデータ通信が良い例です。
コンピュータ間のデータ通信は、 OSI階層モデル や TCP/IP プロトコル・スイートで定められたルールに従い処理されます。
レイヤ7のアプリケーション層にデータが届けられるまで、レイヤ1の物理層から発信された電気信号が符号化され、符号化されたフレームを異なるネットワークの指定アドレスのホストに届ける為にパケット化され、更にホストに届いたパケットはTCPやUDPのポート番号で分類され、 SSL で暗号化され…、といった仕組みの理解が無いと、原因究明に困ってしまいます。
アプリケーションが正常に動作しない原因は、アプリケーション自体のバグや設定ミスが原因であることもありますが、原因がネットワークに関係する場合、それが暗号化の問題なのか、ポート指定の問題なのか、ルーティング上の問題なのか、それとも単純にケーブルが抜けているのか?(話が少しそれるが、実はこれが原因であることが意外に多い)など知識と経験と勘を頼りに切り分けを行う必要があります。
オンプレミスのシステムで、ハード/ミドルウエア/アプリケーションという構成を知っていれば障害発生時にその知見が役立ちます。
コメント ( 0 )
トラックバックは利用できません。
この記事へのコメントはありません。