NVIDIA GeForce RTX 50「Blackwell」フラッグシップは、最大 192 個の SM ユニットと 512 ビットバスを備えた GB202 GPU を搭載していると伝えられています

NVIDIA の次世代 GeForce RTX 50 "Blackwell" GPU の噂がKopite7kimiなどの信頼できるリーカーから展開され始めています。

NVIDIA のGeForce RTX 50 "Blackwell" GPU の噂は、最後の GeForce RTX 40 GPU が市場に投入され終わった数か月前にすでに始まっていました。「Ada-Next」と名付けられたこれらの次世代チップは、公式ロードマップによれば 2025 年のリリースを目標としている NVIDIA の新しいゲームラインアップの基礎となりますが、発売がもっと早くなる可能性があるという噂もあります。

As I mentioned before, GA100 is 8*8, and GH100 is 8*9. GB100 will have a basic structure like 8*10. GB202 looks like 12*8.
— kopite7kimi (@kopite7kimi) 2023年9月28日

Kopite7kimi が Blackwell GPU の 2 つの構成について X に投稿しました。1 つ目は、GB100 として知られる HPC/AI 指向のチップで、最近 TSMC 3nm プロセスノードを利用し、2024 年後半の発売を目標としていると発表されました(GTC 2024 中に発表)。

GB100 GPU は、MCM 設計を利用する NVIDIA の最初の HPC チップになる予定で、クラスターあたり 10 個の TPC を含む 8 GPC クラスターに基づいており、各クラスターは 2 個の SM を搭載し、完全な実装で合計 160 個の SM ユニットを搭載します。ダイを有効にしました。上部ダイには、HBM3e などの最新の HBM 標準をサポートする 8192 ビット幅のバスインターフェイスも搭載されます。

Ampere と Hopper は両方とも、異なる FP32/FP64 コア数の配置を特徴としていますが、NVIDIA が Blackwell の SM あたり 128 個の FP32 コア数に従う場合、完全に有効化されたダイでは最終的に 20,480 個の FP32 コアが搭載される可能性があります。以下は、NVIDIA HPC パーツを Blackwell GB100 と比較したものです。

・A100 (アンペア) - 8 GPC / 64 TPC / 128 SM / SM あたり 64 コア / 8192 コア / 5120 ビット
・H100 (ホッパー) - 8 GPC / 72 TPC / 144 SM / SM あたり 128 コア / 18,432 コア / 5120 ビット
・B100 (Blackwell) - 8 GPC / 80 TPC / 160 SM / SM あたり 128 コア / 20,480 コア / 8192 ビット

ゲーム部分に話を戻すと、GB202 GPU は、これまでのゲーム/HPC の発表で見てきたように、大きく異なる GPU 構成を備えていると噂されています。このチップには、合計 8 個の TPC を含む 12 個の GPC が搭載される予定で、ダイ全体で合計最大 96 個の TPC または 192 個の SM になります。もう一度言いますが、NVIDIA が SM ごとに同じ 128 FP32 コアを使用する場合、最大 24,576 コアが得られ、AD102 GPU 全体に比べてコア構成が 33% 向上します。もちろん、完全な AD102 GPU を搭載したゲーム GPU はまだ見たことがないため、NVIDIA は次世代 GeForce RTX 50 ゲームラインアップでカットダウン GB202 ダイを発売し、ハイエンドバージョンも発売する可能性があります。 GPU の歩留まりが向上した場合、または競合に取り組む必要がある場合に市場に投入します。

Sorce:wccftech既存の噂に基づいた NVIDIA の GB202 GPU ブロック図のモックアップ。

NVIDIA は、従来のコアだけを GPU に追加することから脱却し、GPU 内に AI、Tensor、ニューラル処理、レイトレーシング操作用のさまざまな種類のコアとアクセラレータを搭載しているため、NVIDIA が Blackwell を導入するまでに、既存の Ada Lovelace 構成が使用できなくなる可能性があります。時代遅れのデザインである可能性は十分にあります。

Kopite7kimi 氏はまた、GeForce RTX 50 GPU 用の NVIDIA GB202 "Blackwell" GPU には、既存の主力チップに搭載されている 384 ビット幅のバスインターフェイスよりも 33% 増加する、より広い 512 ビットバスインターフェイスが搭載される予定であると繰り返し述べています。

How much L2 Cache and Memory bit bus?
— Warren Tarbiat (@Dangerman1337) 2023年9月28日

また、Chiphell フォーラムからは、NVIDIA の GeForce RTX 50 "Blackwell" フラッグシップがコア数の 50% 増加、メモリ帯域幅の 52% 増加、キャッシュサイズの 78% 増加、および 15% の増加を特徴とすることを示唆するいくつかの噂もあります。コア周波数が向上し、全体的な GPU パフォーマンス能力が 70% 向上します。NVIDIA が GeForce RTX 50 フラッグシップグラフィックスカードの最終仕様を決定することを伝えるのはまだ少し時期尚早であり、NVIDIA は実際にどの SKU を市場に投入するかを決定する前に、いくつかの SKU に取り組んでいることが知られています。発売を控えて、これほど早い段階で何かを最終決定と呼ぶのは賢明ではありません。しかし、これらのレポートに基づくと、GeForce RTX 50 GPU には次のような特徴があります。

・24,576 CUDA コア (GB202 GPU)
・32 Gbps のメモリ速度 (GDDR7)
・~3000 MHz のピーク GPU クロック速度
・128 MB L2 キャッシュ (GPU 用)

Samsung と SK Hynix は、次世代 GPU ラインアップとして NVIDIA に次世代 GDDR7 DRAM モジュールのサンプル提供を開始したとすでに報告されています。新しいモジュールは最大 32 Gbps のピン速度を備え、512 ビットバスインターフェイス全体で最大 2 TB/秒の帯域幅を提供することが期待されています。これは、GDDR 帯域幅機能が大幅に向上し、4090 などの現在最速の RTX GPU と比較して 2 倍の増加を示します。

確かにこれらすべては興味深いものですが、これらは噂であり、次世代の GeForce RTX シリーズが発売されるまでにどれだけ真実が判明するかを待つ必要があることを覚えておく必要があります。