オークリッジのエクサスケール「Frontier」システムがTop500で世界最高性能のスパコンに

スーパーコンピュータ「Frontier」がついに稼動し、年2回のスーパーコンピュータランキング「Top500」に史上初のスコアを提出し、1位を獲得しました。

オークリッジ国立研究所のこのシステムは、公式に世界最速のスーパーコンピュータとなり、エクサスケール(1秒間に少なくとも10億(1018)回の浮動小数点演算が可能なスーパーコンピュータ)の壁を突破した最初のシステムとなります。

しかし、中国は1年以上前から2つのエクサスケールシステムを運用していますが、それらを比較的秘密にし、Top500には提出していません。

このスーパーコンピュータFrontierは74台のキャビネットで構成され、1台の重量は8,000ポンド(約3,628kg)です。また、9,408台のHPE Cray EXノードを搭載し、それぞれにAMD「Trento」7A53 Epyc CPUを1基、AMD Instinct MI250X GPUを4基、合計37,632基のGPUを搭載しています。システム全体では、8,730,112コアを搭載しています。

メモリは9.2ペタバイト(HBMとDDR4が半々)、そして90マイルのネットワークケーブルが必要とされるHPE Slingshot-11で相互接続されています。また、37ペタバイトのノードローカルストレージと、716ペタバイトのセンターワイドストレージを搭載しています。システムは温水(85°F/29.4℃)で液冷され、350馬力のポンプ4台で毎分6,000ガロンの温水がシステム内を循環しています。

また、スペースとしては372平方メートルの広さを占有し、ピーク時には40MWの電力を消費します。

Frontierはまだ完全には起動していません。システムのさらなるテストと検証が必要で、初期の科学アクセスは2022年後半、科学ワークロードの完全な開放は2023年初頭になると予想されています。

Top500で採用されている主要なHigh-Performance Linpack(HPL)ベンチマークにおいて、Frontierは1.102エクサフロップスの持続的な性能を達成しました。理論上のピーク性能は1.686エクサフロップスであり、オークリッジはいずれ2エクサフロップスに到達できるだろうと考えているようです。

AIの性能計算に有用な混合精度計算ベンチマークでは、6.88エクサフロップスを達成し、これも世界最速となりました。

Frontier(Frontier Test & Development System)は、1ラックで1ワットあたり52.23ギガフロップスの性能を発揮し、前回1位のシステムより32%効率化され、世界で最もエネルギー効率の高いスーパーコンピュータとしてGreen500リストの1位を獲得しました。

前回世界最速のスーパーコンピュータの地位を獲得した「富岳」は、ベンチマークのひとつであるHigh-Performance Conjugate Gradient(HPCG)において首位を維持しました。ただ、16.0HPCG-petaflopsでトップとなりましたが、これはフロンティアがHPCGランキングを提出しなかったためであるようです。

オークリッジ国立研究所のコンピューティング&コンピュテーションサイエンス担当アソシエイトディレクターであるJeff Nichols氏は、次のように述べています。「今年後半に研究者がフル稼働するFrontierシステムにアクセスできるようになれば、3年以上前からエネルギー省やHPE、AMDの業界パートナーなど数多くの有能な人々が関わってきた仕事の集大成となるだろう」

「世界中の科学者やエンジニアが、この驚異的な計算速度を活かして、この時代の最も困難な問題の解決に取り組み、その多くが初日からその探究を始めるだろう」

Frontierに続くのは、同じく昨年末に導入が開始されたAuroraです。これはIntelのPonte Vecchio GPUを搭載し、2エクサフロップスの能力が期待されています。

来年には、さらに2エクサフロップスのシステムとして、AMDを搭載したスパコン「El Capitan」が予定されています。

しかし、Frontierは公式には世界最強のスーパーコンピュータとなりましたが、昨年初めに発表された中国の2つのエクサスケールシステムとは対峙していません。このどちらもTop500テストへの提出は行われていませんが、昨年末にその性能に関する報告が表面化しました。

Sunway OceanLightは、ピーク時で約1.3エクサフロップス、持続時で約1.05エクサフロップス程度とされ、これはFrontierがややリードしていることになります。

しかし、もう1台の「Tianhe-3(天河3号)」は、ピーク時で1.7エクサフロップス/持続時1.3エクサフロップスとみられ、世界最強のスパコンであることになります。

しかし、ソフトウェアの最適化では米国が先行しており、より高い性能を引き出すことができると考えられています。また、中国は単にHPLの性能を上げるためにシステムを構築しており、Frontierのような汎用性はないとする意見もあるようです。

しかし、さらに問題を複雑にするのは、HPL自体が世界最速のスパコンを決定するための指標として疑問視されていることです。「Linpackの性能が良いようにシステムを設計すると、今日のアプリケーションからすると間違った設計の選択になることがある」と、ジャック・ドンガラ教授は今月初めにこのように認めていました。

1979年にこのベンチマークを作成したドンガラ氏は、作成当時とは状況がだいぶ変わってきており、スーパーコンピュータ用の新たなベンチマークを考えるべきであると述べています。

この記事は海外Data Centre Dynamics発の記事をData Center Cafeが日本向けに抄訳したものです。

関連記事一覧

  • コメント ( 0 )

  • トラックバックは利用できません。

  1. この記事へのコメントはありません。