適応型演算アクセラレーションによるコアインフラストラクチャのパフォーマンス向上

Data Center Cafe
2020.05.26
410 views

【スポンサーコンテンツ】

著者: Mike Thompson氏 (ザイリンクス Virtex UltraScale+ FPGA & Versal プレミアム ACAP 担当シニアプロダクトラインマネージャー)

あらゆるところに AI、常時オン、そしてデータ中心の時代を迎え、今日のテクノロジやフォームファクターの能力を超えた高帯域幅の拡大が求められている中、現在の CPU および GPU テクノロジを超えて拡張できる、より効率的で汎用性の高い演算性能が求められています。

はじめに: 常時オン、データ中心、あらゆるところに AI

お金を抜きにして考えれば、この世界を回しているのはデータだといえます。都市計画、健康状態の記録、環境保護、ビジネスの向上といったさまざまな目的でデータを取り込むリモートの IoT エンドポイントから、コンテンツのストリーミングや日常生活のオンライン共有のニーズ、常時接続されたパーソナル IoT デバイスの民生品利用の拡大、企業リサーチや科学研究を目的とした AI 中心型アプリケーションへの依存増加に至るまで、ありとあらゆるものの中心にデータの移動、管理、分析が存在しています。

デジタルライフスタイルと新たに出現した IoT は、クラウドでのコンピューティングサービスやデータサービスの急成長と密接な関係があります。新しい生活スタイルや働き方、外出先からもアクセスする大量のパーソナルコンテンツの保存手段、オンデマンドの音楽や動画ストリーミングサービスのホスト手段、産業データや企業データの収集および分析手段の中心にあるのがクラウドです。また、財務分析やデータベース検索、ゲノム解読などのタスクに高性能なソフトウェアアプリケーションをサイクルベースの低コストで利用できるものもクラウドの恩恵です。

さらに、大量端末接続 (MMTC) と超低遅延通信 (ULLC) をサポートして新たなリアルタイムセルラーサービスを実現する 5G New Radio (NR) により、バックホールネットワーク、メトロネットワーク、コアネットワークの容量とパフォーマンスに対する需要は今後ますます増加すると見込まれています。

コアインフラストラクチャに対する需要の増加

今日のすべてのクラウドデータセンターや通信ネットワークおよびセルラーバックホールネットワークは、データセンターへ/からのリンクや、地理的に分散されたデータセンターサイト、インフラストラクチャインターフェイスカード、アクセラレーターカードをつなぐデータセンターインターコネクト (DCI) などの主要コンポーネントに接しており、データ帯域幅の拡張と演算スループットの向上が強く求められています。実際に、コアインフラストラクチャにおけるデータ帯域幅の需要は、公称では年平均成長率 (CAGR) 51% で増加しており、5G展開だけを要因としてもエリアトラフィック容量の需要は 100 倍に増える見込みです。

プロトコル処理やインターフェイスチップなどのディスクリートコンポーネントでこれらの需要に応えるべく、より高性能な新型機器を開発するのは複雑で時間がかかるだけでなく、パフォーマンスの需要に合わせた拡張が一層難しくなるという問題もあります。しかも、このような設計によるシステムは大型で消費電力が非常に高いため、データセンターやインフラストラクチャ用機器のスペース、消費電力、温度管理に対する制約事項を満たすことができません。次世代の機器は、これまでの物理的、電気的、温度的制限内でパフォーマンスを大幅に向上させる必要があります。

さらに、設計作業では、できるだけ早く市場に出す準備をするため、最終的な仕様が承認される前に最新のプロトコルや規格を使用し始める必要もあります。少しでも早く製品を市場投入したい機器プロバイダーが仕様が成熟するまで待つことはありません。そのため、プロジェクトの進行に伴いハードウェアレベルで適応できる柔軟性も求められます。

革新的なプログラマブルアクセラレーター

高集積度の FPGA やプログラマブルシステムオンチップ IC (MPSoC) などのプログラマブルロジックデバイスは、従来の CPU または GPU アーキテクチャでは十分な速度で実行できないワークロードや、消費電力の制約事項を満たすことのできないワークロード向けのアクセラレーターとして使用されるようになりました。これらのデバイスは、信号処理や最近ではニューラルネットワークなどといった演算に関する具体的な課題を非常に効果的に解消する高度な並列処理が可能であり、またプログラマブルデバイスとしての適応性も備わっています。

現在は、より新しく厳しいパフォーマンス目標、帯域幅目標、消費電力目標、統合目標を達成するため、ACAP (適応型演算アクセラレーションプラットフォーム) と呼ばれる新しいクラスのプログラマブルデバイスが登場しています。ザイリンクス Versal™ ACAP には、インテリジェントな AI および DSP演算エンジン、FPGA ロジックファブリックに相当する適応型エンジン、アプリケーション処理エンジン、リアルタイムスカラーエンジンがあり、プログラマブルネットワークオンチップ (NoC) インターコネクトを通して密結合されています。また、ソフトウェア制御によるプラットフォーム管理と最新のインターフェイス (DDR4、100G イーサネット、PCIe® Gen 5、数ギガビットの光インターフェイスなど) も統合されています。

Versal DSP エンジンは、INT8 や 32 ビット浮動小数点などのオペランドをネイティブサポートする改良型 DSP ブロックを特長としています。これにより、デジタル信号処理だけでなく、多入力ダイナミックバスシフター、メモリアドレスジェネレーター、多入力バスマルチプレクサー、メモリマップド I/O レジスタも含むアプリケーションの速度と効率性が向上します。スカラーエンジンは、デュアルコア Arm® Cortex™-A72 アプリケーションプロセッサとデュアルコア Arm® Cortex™-R5F リアルタイムプロセッシングユニットで構成されています。ACAP のヘテロジニアスエンジンは、経時変化するワークロードに合わせて、あるいはアルゴリズムの実装やニューラルネットワークモデルの進化に伴って再プログラミングが可能です。

1 2 3