NVIDIAは最新のAI向けGPU「Blackwell」アーキテクチャに設計上の問題があったことを明らかにした。これにより製造が停滞し、主要顧客であるMetaやMicrosoft、Alphabetのスケジュールにも影響が及んでいたという。

CEOのジェンセン・フアンは、問題の責任はNVIDIAにあり、TSMCと協力して修正を完了したと述べた。新型「B200」チップは、従来のH100に比べて最大30倍の推論速度を誇る。B200は2080億トランジスタを備え、192GBのメモリでより高度なAIトレーニングを実現する。しかし、この問題は一般消費者向けGPUには影響しない見込みである。

Blackwellアーキテクチャの設計問題が判明

Blackwellアーキテクチャに問題があるとの噂が流れていたが、それが真実であることをNVIDIAは正式に認めた。新しいアーキテクチャを採用したAI向けGPUは、当初設計上の欠陥が原因で生産の歩留まりが著しく低下し、予定されていた出荷が遅れることとなった。

これにより、MetaやMicrosoft、Alphabetなどの大手顧客が必要とする製品の供給に遅れが生じ、業界内での影響が懸念されていた。CEOのジェンセン・フアンは、この問題がNVIDIA自身の責任であり、原因を解明して迅速に解決したと語った。アーキテクチャ全体を再設計する必要があったため、7種類の異なるチップが新たに開発され、一斉に量産へと投入されたという。

TSMCとの連携で問題を修正

問題の解決にはNVIDIAとTSMCの協力が不可欠だった。TSMCは世界有数の半導体製造企業であり、NVIDIAは同社の製造プロセスを利用して修正を施した。特に、4NPプロセスを用いた2080億トランジスタの製造は非常に難易度が高く、問題解決には技術的な挑戦が伴った。

しかし、NVIDIAはTSMCとの関係が悪化しているとの噂を否定し、今回のトラブルは両社が協力して乗り越えたと説明している。結果として、NVIDIAは再設計後のBlackwellチップの生産を順調に進め、予定通り年内の出荷を目指している。これは顧客への信頼回復にもつながる重要なステップである。

新チップ「B200」の性能と技術革新

B200チップは、Blackwellアーキテクチャを採用した最新のAI向けGPUであり、従来モデルに比べ大幅な性能向上を果たしている。特に、H100チップと比較してモデルのトレーニング速度が4倍、推論速度が30倍に達するなど、AI処理の高速化が顕著である。

また、エネルギー効率も25%向上しており、大規模データセンターにおける運用コスト削減が期待されている。B200は2基の1040億トランジスタGPUを10TB/sのインターコネクトで結合するという設計を採用し、これにより高い並列処理能力を実現している。さらに、192GBのHBM3eメモリを搭載し、より複雑なAIモデルのトレーニングにも対応可能である。

消費者向けGPUへの影響は限定的

Blackwellアーキテクチャの問題はAI向けの特定用途GPUに限られており、一般消費者向けのグラフィックカードには影響しないとNVIDIAは明言している。AI処理向けGPUは大規模なデータセンターやクラウド環境での使用を想定しており、その設計や製造プロセスは消費者向け製品とは異なる。

消費者向けGPUは、サイズも性能も異なり、用途もゲームや映像編集に特化しているため、今回の問題による直接的な影響はほとんどないと見られている。しかし、B200チップの技術革新が今後の消費者向けGPU開発にフィードバックされる可能性は高く、次世代のNVIDIA製品に新技術が活用されることが期待される。こうした技術の還元が実現すれば、より高性能で効率的なGPUが一般ユーザーにも提供されるだろう。