適応型演算アクセラレーションによるコアインフラストラクチャのパフォーマンス向上

【スポンサーコンテンツ】

著者: Mike Thompson氏 (ザイリンクス Virtex UltraScale+ FPGA & Versal プレミアム ACAP 担当シニア プロダクト ライン マネージャー)

あらゆるところに AI、常時オン、そしてデータ中心の時代を迎え、今日のテクノロジやフォーム ファクターの能力を超えた高帯域幅の拡大が求められている中、現在の CPU および GPU テクノロジを超えて拡張できる、より効率的で汎用性の高い演算性能が求められています。

はじめに: 常時オン、データ中心、あらゆるところに AI

お金を抜きにして考えれば、この世界を回しているのはデータだといえます。都市計画、健康状態の記録、環境保護、ビジネスの向上といったさまざまな目的でデータを取り込むリモートの IoT エンドポイントから、コンテンツのストリーミングや日常生活のオンライン共有のニーズ、常時接続されたパーソナル IoT デバイスの民生品利用の拡大、企業リサーチや科学研究を目的とした AI 中心型アプリケーションへの依存増加に至るまで、ありとあらゆるものの中心にデータの移動、管理、分析が存在しています。

デジタル ライフスタイルと新たに出現した IoT は、クラウドでのコンピューティング サービスやデータ サービスの急成長と密接な関係があります。新しい生活スタイルや働き方、外出先からもアクセスする大量のパーソナル コンテンツの保存手段、オンデマンドの音楽や動画ストリーミング サービスのホスト手段、産業データや企業データの収集および分析手段の中心にあるのがクラウドです。また、財務分析やデータベース検索、ゲノム解読などのタスクに高性能なソフトウェア アプリケーションをサイクル ベースの低コストで利用できるものもクラウドの恩恵です。

さらに、大量端末接続 (MMTC) と超低遅延通信 (ULLC) をサポートして新たなリアルタイム セルラー サービスを実現する 5G New Radio (NR) により、バックホール ネットワーク、メトロ ネットワーク、コア ネットワークの容量とパフォーマンスに対する需要は今後ますます増加すると見込まれています。

コアインフラストラクチャに対する需要の増加

今日のすべてのクラウド データセンターや通信ネットワークおよびセルラー バックホール ネットワークは、データセンターへ/からのリンクや、地理的に分散されたデータセンター サイト、インフラストラクチャ インターフェイス カード、アクセラレーター カードをつなぐデータセンター インターコネクト (DCI) などの主要コンポーネントに接しており、データ帯域幅の拡張と演算スループットの向上が強く求められています。実際に、コア インフラストラクチャにおけるデータ帯域幅の需要は、公称では年平均成長率 (CAGR) 51% で増加しており、5G展開だけを要因としてもエリア トラフィック容量の需要は 100 倍に増える見込みです。

プロトコル処理やインターフェイス チップなどのディスクリート コンポーネントでこれらの需要に応えるべく、より高性能な新型機器を開発するのは複雑で時間がかかるだけでなく、パフォーマンスの需要に合わせた拡張が一層難しくなるという問題もあります。しかも、このような設計によるシステムは大型で消費電力が非常に高いため、データセンターやインフラストラクチャ用機器のスペース、消費電力、温度管理に対する制約事項を満たすことができません。次世代の機器は、これまでの物理的、電気的、温度的制限内でパフォーマンスを大幅に向上させる必要があります。

さらに、設計作業では、できるだけ早く市場に出す準備をするため、最終的な仕様が承認される前に最新のプロトコルや規格を使用し始める必要もあります。少しでも早く製品を市場投入したい機器プロバイダーが仕様が成熟するまで待つことはありません。そのため、プロジェクトの進行に伴いハードウェア レベルで適応できる柔軟性も求められます。

革新的なプログラマブルアクセラレーター

高集積度の FPGA やプログラマブル システム オン チップ IC (MPSoC) などのプログラマブル ロジック デバイスは、従来の CPU または GPU アーキテクチャでは十分な速度で実行できないワークロードや、消費電力の制約事項を満たすことのできないワークロード向けのアクセラレーターとして使用されるようになりました。これらのデバイスは、信号処理や最近ではニューラル ネットワークなどといった演算に関する具体的な課題を非常に効果的に解消する高度な並列処理が可能であり、またプログラマブル デバイスとしての適応性も備わっています。

現在は、より新しく厳しいパフォーマンス目標、帯域幅目標、消費電力目標、統合目標を達成するため、ACAP (適応型演算アクセラレーション プラットフォーム) と呼ばれる新しいクラスのプログラマブル デバイスが登場しています。ザイリンクス Versal™ ACAP には、インテリジェントな AI および DSP演算エンジン、FPGA ロジック ファブリックに相当する適応型エンジン、アプリケーション処理エンジン、リアルタイム スカラー エンジンがあり、プログラマブル ネットワーク オン チップ (NoC) インターコネクトを通して密結合されています。また、ソフトウェア制御によるプラットフォーム管理と最新のインターフェイス (DDR4、100G イーサネット、PCIe® Gen 5、数ギガビットの光インターフェイスなど) も統合されています。

Versal DSP エンジンは、INT8 や 32 ビット浮動小数点などのオペランドをネイティブ サポートする改良型 DSP ブロックを特長としています。これにより、デジタル信号処理だけでなく、多入力ダイナミック バス シフター、メモリ アドレス ジェネレーター、多入力バス マルチプレクサー、メモリ マップド I/O レジスタも含むアプリケーションの速度と効率性が向上します。スカラー エンジンは、デュアル コア Arm® Cortex™-A72 アプリケーション プロセッサとデュアル コア Arm® Cortex™-R5F リアルタイム プロセッシング ユニットで構成されています。ACAP のヘテロジニアス エンジンは、経時変化するワークロードに合わせて、あるいはアルゴリズムの実装やニューラル ネットワーク モデルの進化に伴って再プログラミングが可能です。

関連記事一覧

  • コメント ( 0 )

  • トラックバックは利用できません。

  1. この記事へのコメントはありません。