[開発者向け]NVIDIA H100がGraph500で世界記録を樹立、GPU専用アーキテクチャでグラフ処理を革新

目次

はじめに

 NVIDIAが2025年12月10日、グラフ処理の業界標準ベンチマークであるGraph500で世界記録を達成したことを発表しました。CoreWeaveのクラウドプラットフォーム上で実施されたこの記録は、従来のCPUベースのアプローチからGPU専用ソリューションへの技術的転換を示すものです。本稿では、この成果の技術的詳細と、高性能計算分野における意義について解説します。

参考記事

要点

  • NVIDIAは第31回Graph500幅優先探索(BFS)ベンチマークで410兆TEPS(秒あたりの走査エッジ数)を記録し、世界第1位を獲得した
  • CoreWeaveのダラスデータセンターで8,192台のH100 GPUを使用し、2.2兆の頂点と35兆のエッジを持つグラフを処理した
  • 上位10位内の他システムが約9,000ノードを使用したのに対し、NVIDIAは約1,000ノードで3倍優れたコストパフォーマンスを実現した
  • InfiniBand GPUDirect Async(IBGDA)とNVSHMEMを用いた新しいGPU間アクティブメッセージング技術により、CPUを介さずGPU上で完全に処理を実行する
  • この成果は、流体力学や気象予測などスパースデータ構造を扱う高性能計算分野への応用可能性を示している

詳細解説

Graph500ベンチマークとその重要性

 NVIDIAによれば、今回の記録は410兆TEPS(秒あたりの走査エッジ数)に達し、国立研究所が運用するシステムを含む他の上位システムの2倍以上の性能を示しました。この性能を実感的に理解するため、NVIDIAは次のような例を示しています。地球上のすべての人が150人の友人を持つと仮定すると、1.2兆のエッジを持つソーシャルグラフが形成されます。今回達成された性能では、地球上のすべての友人関係を約3ミリ秒で検索できることになります。

 Graph500 BFSベンチマークは、システムが大規模な不規則データをどれだけ効率的に処理できるかを測定する業界標準の指標です。グラフは現代技術の基盤となる情報構造であり、ソーシャルネットワークや銀行アプリケーションなど、日常的に私たちが利用するサービスで使われています。例えばLinkedInでは、ユーザープロフィールが頂点、他のユーザーとのつながりがエッジとして表現されます。あるユーザーは5つのつながりを持ち、別のユーザーは50,000のつながりを持つといった具合に、グラフ全体で密度が不均一になるため、スパース(疎)で不規則な構造となります。

 TEPSの高いスコアは、単にCPUやGPUの処理速度だけでなく、計算ノード間のケーブルやスイッチといった相互接続、メモリ帯域幅、そしてシステムの能力を最大限に活用できるソフトウェアの優秀さを証明するものです。

従来のCPUベースのグラフ処理の課題

 NVIDIAの説明では、従来のCPUアーキテクチャでは、グラフデータを計算ノード間で移動させながら処理を行います。グラフが数兆のエッジにスケールすると、この絶え間ないデータ移動が通信のボトルネックを生み出します。

 この問題を回避するため、開発者はアクティブメッセージングと呼ばれるソフトウェア技術を使用してきました。アクティブメッセージングでは、データを移動させる代わりに、データが存在する場所で処理を実行できるメッセージを送信します。メッセージはデータそのものより小さく、グループ化してネットワーク効率を最大化できるため、処理を大幅に高速化できます。

 しかし、従来のアクティブメッセージングはCPU上で動作するように設計されており、CPUシステムのスループット能力と計算性能によって本質的に制限されていました。GPUはAI学習のような密なワークロードの加速で知られていますが、最大規模のスパース線形代数やグラフワークロードは、最近まで従来のCPUアーキテクチャの領域にとどまっていたとNVIDIAは指摘しています。

GPU専用ソリューションによる革新

 今回の記録達成のため、NVIDIAはデータがネットワーク上をどのように移動するかを根本から再設計した、フルスタックのGPU専用ソリューションを開発しました。

 NVIDIAによれば、InfiniBand GPUDirect Async(IBGDA)とNVSHMEM並列プログラミングインターフェースを使用して開発されたカスタムソフトウェアフレームワークにより、GPU間でのアクティブメッセージングが可能になりました。IBGDAを使用することで、GPUはInfiniBandネットワークインターフェースカードと直接通信できます。

 この技術革新の核心は、メッセージ集約の仕組みです。CPUでは数百のスレッドしかアクティブメッセージを送信できませんが、GPU上では数十万のGPUスレッドが同時にアクティブメッセージを送信できるよう、メッセージ集約が一から設計されています。並列処理の観点から見ると、これは処理能力の大幅な向上を意味します。

 この再設計されたシステムでは、アクティブメッセージングがCPUを完全にバイパスして、GPU上で完全に動作します。これにより、NVIDIA H100 GPUの大規模な並列性とメモリ帯域幅を最大限に活用して、メッセージの送信、ネットワーク上での移動、受信側での処理が可能になりました。

コスト効率と実用性

 速度だけでなく、効率性も今回の成果の重要な要素です。NVIDIAによれば、Graph500リストの上位10位内の比較可能なエントリーは約9,000ノードを使用していましたが、今回の記録は約1,000ノードで、ドルあたり3倍優れた性能を実現しました。

 この実行は、NVIDIAパートナーであるCoreWeaveの安定した高性能インフラストラクチャ上で行われました。商用利用可能なシステムでこの規模の時間とコストを大幅に削減したことは、NVIDIAコンピューティングプラットフォームが、AI学習のような密なワークロードに加えて、世界最大のスパースで不規則なワークロードの加速へのアクセスを民主化する準備ができていることを示しています。

 「民主化」という表現が使われていますが、これは商用クラウドサービスで利用可能であることを意味しており、国立研究所などの特殊な環境でしか実現できなかった性能が、一般企業でもアクセス可能になったという文脈で理解できます。

高性能計算への波及効果

 NVIDIAの発表では、この技術革新が高性能計算に大きな影響を与えると述べられています。流体力学や気象予測などのHPC分野は、ソーシャルネットワークやサイバーセキュリティを支えるグラフと同様のスパースデータ構造と通信パターンに依存しています。

 数十年間、これらの分野は最大規模ではCPUに縛られてきました。データが数十億から数兆のエッジにスケールする中でも、従来のCPUアーキテクチャが主流でした。今回のGraph500での記録、および他の2つの上位10位内のエントリーは、大規模高性能計算のための新しいアプローチを検証するものです。

 NVIDIAのコンピューティング、ネットワーキング、ソフトウェアのフルスタック統合により、開発者はNVSHMEMやIBGDAのような技術を使用して、最大規模のHPCアプリケーションを効率的にスケールできるようになります。これにより、スーパーコンピューティング性能が商用利用可能なインフラストラクチャにもたらされることになります。

まとめ

 NVIDIAのGraph500記録達成は、GPU専用アーキテクチャによるグラフ処理の技術的ブレークスルーを示しています。従来のCPUベースのアプローチを根本から再設計し、IBGDAとNVSHMEMを活用したGPU間アクティブメッセージングにより、性能とコスト効率の両面で大幅な改善を実現しました。この成果は、流体力学や気象予測などのHPC分野にも応用可能であり、商用クラウドサービスを通じて広範な開発者がアクセスできる点が重要と考えられます。

この記事が気に入ったら
フォローしてね!

  • URLをコピーしました!
  • URLをコピーしました!
目次