[技術紹介]AIインフラの「ネットワーキングの壁」を破壊する新光通信技術「MOSAIC」とは

目次

はじめに

 AIの性能向上に伴い、GPU(Graphics Processing Unit)間のデータ通信量が爆発的に増加し、ネットワークがシステム全体の性能を左右するボトルネックとなりつつあります。本稿では、Microsoft Researchが2025年9月9日に発表したブログ記事「Breaking the networking wall in AI infrastructure」を基に、この現代のAIシステムが直面している課題「ネットワーキングの壁」と、それを解決するために開発された新しい光通信技術「MOSAIC」について解説します。

参考記事

要点

  • AIインフラの性能は、GPU間の通信を行うネットワークがボトルネックとなる「ネットワーキングの壁」に直面している。
  • 従来の通信ケーブルは、電力効率と信頼性に優れるが短距離の「銅線」と、長距離伝送が可能だが高消費電力・低信頼性の「光ファイバー」という根本的なトレードオフを抱えている。
  • Microsoftは、このトレードオフを解消する新しい光通信技術「MOSAIC」を開発した。
  • MOSAICは、多数の低速チャネルを並列化する「Wide-and-Slow」アーキテクチャと、ディスプレイ技術である「マイクロLED」を光源に採用した
  • これにより、銅線並みの低消費電力・高信頼性と、光ファイバー並みの長距離伝送(最大50m)を同時に実現させた。
  • 本技術は、AIインフラの物理的な設計制約を緩和し、リソースの分離(disaggregation)といった新しいアーキテクチャの実現を可能にする可能性を秘めている。

詳細解説

AIインフラを阻む「ネットワーキングの壁」とは?

 まず、「ネットワーキングの壁」について理解を深める必要があります。これは、かつてコンピュータの性能向上の足かせとなった「メモリの壁」(CPUの処理速度にメモリのアクセス速度が追いつかなくなった問題)になぞらえた言葉です。AI分野では、GPUの計算能力が飛躍的に向上する一方で、GPU間でデータをやり取りするネットワークの性能が追いつかず、システム全体の効率が頭打ちになってしまう現象を指します。

 現在のデータセンターでは、GPU間の通信に主に2種類の物理ケーブルが使われていますが、それぞれに一長一短があります。

  • 銅線ケーブル(カッパーリンク)
    • 長所: 電力効率が高く、信頼性も高い。
    • 短所: 伝送距離が非常に短い(2メートル未満)。高速な信号を送ると減衰が激しくなるため、同じサーバーラック内の接続など、ごく近距離に用途が限定されます。
  • 光ファイバーケーブル
    • 長所: 数十メートルの長距離伝送が可能。
    • 短所: 消費電力が大きく、故障率が銅線に比べて最大100倍も高い。これは、光信号を生成するレーザーの駆動や、信号の劣化を補正するための複雑な電子回路が多くの電力を必要とするためです。

 このトレードオフにより、AIインフラの設計者は「性能のためにGPUを密集させて超高密度なラックを作るが、その結果、冷却や電力供給が極めて困難になる」といった厳しい選択を迫られています。これが、AIインフラの規模拡大を妨げる「ネットワーキングの壁」とよばれている現象です。

壁を打ち破る技術「MOSAIC」

 Microsoftが開発した「MOSAIC」は、この「距離」と「電力・信頼性」のトレードオフを解消することを目指した技術です。その核心は、2つの重要な技術的アプローチにあります。

技術的ポイント①:「Wide-and-Slow」アーキテクチャ

 従来の通信技術は、少数のチャネル(通り道)で非常に高速なデータを送る「Narrow-and-Fast(狭く、速く)」という設計でした。例えば、800Gbpsのリンクは、100Gbpsのチャネル8本で構成されます。しかし、この「高速化」こそが、銅線では距離を、光ファイバーでは電力効率を犠牲にする原因でした。

 MOSAICは、この発想を逆転させ、数百もの多数のチャネルで、それぞれは低速なデータを並列に送る「Wide-and-Slow(広く、遅く)」というアーキテクチャを採用しました。一つ一つのチャネルは低速で動作するため、信号の劣化が少なく、消費電力の大きい複雑な補正回路が不要になります。これにより、電力効率と信頼性を大幅に向上させることができます。

技術的ポイント②:「マイクロLED」の採用

 「Wide-and-Slow」を実現するためには、多数の光源を低コストかつ高密度に実装する必要があります。しかし、従来のレーザーではコストと消費電力が高すぎて現実的ではありませんでした。

 そこでMOSAICが採用したのが、スマートウォッチやARデバイスのディスプレイ技術として開発された「マイクロLED」です。

 マイクロLEDは、以下の点でMOSAICに最適なデバイスでした。

  • 小型・高密度: 数十ミクロンと非常に小さく、大規模なアレイ(集合体)として製造できます。例えば、800GbpsのMOSAICリンクは、1mm四方以下のシリコンダイに収まる20×20のマイクロLEDアレイで実現可能です。
  • 高速変調: 小型であるため、数Gbpsでの高速な点滅(変調)が可能です。
  • 高信頼性・低コスト: レーザーに比べて構造がシンプルで温度変化に強く、信頼性が高いという利点があります。

MOSAICがもたらす具体的な利点とインパクト

 この新しいアプローチにより、MOSAICは以下の4つの重要な利点を同時に実現します。

  1. 優れた電力効率: 低速動作により複雑な電子回路が不要になり、光学的な電力要件も低減されます。記事によれば、最大68%の電力削減(ケーブルあたり10W以上)が見込まれます。
  2. 長距離伝送: 光技術を用いることで銅線の距離問題を克服し、最大50メートルの伝送を可能にします。これは銅線の10倍以上の距離です。
  3. 高い信頼性: マイクロLED自体の信頼性の高さに加え、多数のチャネルを持つことで冗長性を持たせやすく、故障率を最大100分の1に低減できます。
  4. 高いスケーラビリティ: 将来的に1.6Tbpsや3.2Tbpsといった更なる高速化が必要になった場合も、チャネル数を増やしたり、各チャネルの速度を少し(4〜8Gbps程度に)上げることで対応できます。

 さらに、MOSAICは既存のネットワーク機器で使われているプラガブルトランシーバー(抜き差し可能な送受信機)と同じ形状で提供でき、既存のインフラを変更することなく導入が可能な点も大きな利点です。

MOSAICの将来性:AIインフラの再構築へ

 MOSAICがもたらす価値は、単なるケーブルの置き換えに留まりません。低消費電力で長距離・広帯域の接続が可能になることで、AIインフラのアーキテクチャそのものを根本から変える可能性を秘めています。

 特に注目されるのが「リソースの分離(Disaggregation)」です。現在はCPU、メモリ、GPUなどが一つのパッケージにまとめられていますが、これらを物理的に分離し、高速なネットワークで接続することで、必要なリソースを必要なだけ柔軟に組み合わせる、より効率的なシステムが構築可能になります。

 MOSAICは、この分離されたコンポーネント間を低電力で長距離接続する手段を提供し、GPUのメモリ容量や帯域幅を飛躍的に向上させる道を開く可能性があります。

まとめ

 本稿では、Microsoft Researchが提案する新しい光通信技術「MOSAIC」について解説しました。MOSAICは、「Wide-and-Slow」アーキテクチャと「マイクロLED」という独自のアプローチにより、長年AIインフラの課題であった銅線と光ファイバーのトレードオフを解消します。

 これにより、銅線並みの低消費電力と高信頼性を保ちながら、光ファイバーのように長距離でデータを伝送することが可能になることが期待されます。

この記事が気に入ったら
フォローしてね!

  • URLをコピーしました!
  • URLをコピーしました!
目次