CerebrasがAI用2.6兆トランジスタ・ウェハースケールの新チップを発表

Cerebras Systemsが、世界最大のコンピューターチップ「WSE」の後継チップである「Wafer Scale Engine 2 (WSE-2)」を発表しました。

7nmの新チップは、2.6兆個のトランジスタと85万個の「AIに最適化された」コアを誇ります。これは、大型GPUの540億個のトランジスタを大幅に上回るものですが、各チップの小売価格は約200万ドル(およそ2.1億円)となっています。

ウェハースケールチップ。大きいことは美しい

米国エネルギー省(Department of Energy:DOE)の国立エネルギー技術研究所(National Energy Technology Lab::NETL)が初代チップのテストを行った際に、CFDワークロードではGPUの10,000倍の速度が得られたが、メモリ容量が小さいため、特にAIモデルでの限界があると述べていました。

NETLは研究論文の中で、「処理、データ、通信のすべてを1つのシリコンウェハー上に置くというアプローチにより、問題がウェハー上に収まる場合には、メモリの帯域幅を排除し、通信の性能限界を大幅に下げることで、劇的なスピードアップを実現し、正確なリアルタイムシミュレーションが可能となることをここで示した」と述べています。

WSE-2では、チップのメモリは2倍以上に増やされ、40GBのオンチップSRAMメモリ、20ペタバイトのメモリ帯域幅、220ペタビットのファブリック総帯域幅が実現されています。

Cerebras Systemsのハードウェア・エンジニアリング部門のVPディラジ・マリク氏は、次のように述べています。「Cerebrasは、世界初のウェーハスケールプロセッサであるWSEを発表してから2年弱、業界に革命をもたらした」

「AI計算処理では、情報をより早く処理し、より短時間で答えを出すことができる大型チップが王様である。そして、時間はAIの進歩の敵でもある。WSE-2は、業界最速・最大のAIプロセッサとして、この大きな課題を解決する」

高価格で新しいアーキテクチャを採用したWSEは、DOEでのテスト導入を含め、ごく一部にしか導入されなかったようです。昨年、Pittsburgh Supercomputing Centerは、Neocortexスーパーコンピュータに2基のWSEプロセッサとHPE Superdome Flexを採用すると発表しました。更に今年に入り、エジンバラ大学が最新のシステムにこのプロセッサを採用しました。

また、グラクソ・スミスクラインや東京エレクトロンデバイスなどもこのシステムを採用しているようです。

グラクソ・スミスクライン(GSK)のAI/ML部門SVPであるキム・ブランソン氏は、次のように述べています。「GSKでは、機械学習を応用して創薬の予測を改善し、病気に対する理解を深め、そして成功率を高めるために、これまで以上に速くデータを蓄積している」

「昨年、私たちは3カ月間で、過去300年の歴史の中で最も多くのデータを生成した。Cerebras CS-1を使ったことで、学習時間を80倍も短縮しながら、生成できるエンコーダモデルの複雑さを向上させることができた。私たちは、AIへの取り組みをさらに加速させ、最終的にはより多くの患者を救うことができるよう、機能が向上したCS-2の納入を心待ちにしている」

Data Center Dynamics

原文はこちら

関連記事一覧

  1. この記事へのコメントはありません。