NVIDIAが2027年に投入予定のRubin Ultraについて、当初計画されていた4GPU構成のパッケージが製造上の問題により断念された可能性があることが明らかになりました。
NVIDIA Rubin Ultraが4チップから2チップ構成に弱体化へ
NVIDIAは2026年後半にRubin世代のAI向けGPUを投入予定で、2基のRubin GPUをNVLink-C2Cで接続し、8基のHBM4チップを搭載するパッケージ構成が計画されています。さらに上位のRubin Ultraでは、EUV露光技術によるGPUダイサイズの物理的な限界を補うため、接続済みのRubin Ultra GPUを2組、合計4基のGPUと16基のHBM4チップを1つのパッケージに搭載するという力技が計画されていました。
しかし、この4チップ構成のパッケージでTSMCのCoWoS-L技術を用いた製造に問題が発生しているとのことです。具体的には、パッケージに反りが生じ、チップと基板の間で十分な接触が確保できない状態になっているとのことで、マイクロメートル単位の微細な変形でも接続不良につながるため、パッケージが大型化するほど反りの問題が深刻化するようです。
そのため、NVIDIAはこの問題を受けて4チップ構成を断念し、2チップ構成のRubin Ultraのみを製造する方針に切り替えた可能性があるとのことです。この構成変更により、クラウドサービスプロバイダーなどでは当初計画していた性能を達成できなくなるため、データセンター建造計画の再考を迫られる可能性があります。ただし、これがデータセンター投資そのものの縮小につながるとは考えにくく、メモリ価格などは引き続き高止まりが続くと考えられます。
なお、NVIDIAは大量のチップを1つのパッケージに搭載する方針自体はあきらめておらず、対策としてガラス基板の採用やChips on Panel on Substrate(CoPoS)などが研究されています。しかし、いずれも量産段階には至っておらず、後継のFeynman世代などで改めて実用化が検討されると見られています。



コメント