NVIDIAは、最新のR555ドライバリリースにより、GeForce RTX GPUおよびRTX AI PCプラットフォームのAI性能をさらに向上させました。
NVIDIAのGeForce RTX GPUおよびRTX PCは、あらゆる分野で最速のAI性能を提供し、最新のドライバーで3倍に向上しました。
今日、Microsoft Buildでは、NVIDIAはGeForce RTX GPU、ワークステーション、およびPCを含むRTXプラットフォームで利用可能なさまざまな新しいAIパフォーマンスの最適化を発表しました。
新しい最適化は、特に最新のGenerative AI体験をサポートするさまざまなLLM(ラージ言語モデル)を対象としています。最新のR555ドライバを使用したNVIDIAのRTX GPUおよびAI PCプラットフォームは、ORT(ONNXランタイム)とDirectMLを介して最大3倍の高速AI性能を提供します。これら2つのツールは、Windows PC上でAIモデルをローカルで実行するために使用されます。
それに加えて、WebNNはDirectMLを介してRTXに加速されました。これは、Web開発者が新しいAIモデルを展開できるアプリケーションプログラミングインターフェースです。マイクロソフトは、PyTorchにDirectMLサポートを追加するとともに、RTX GPUのパフォーマンスをさらに加速するためにNVIDIAと協力しています。以下は、新しいR555ドライバがGeForce RTX GPUおよびRTX PCに提供する機能の完全なリストです。
> LLMのINT4ウェイト専用量子化を処理するためのDQ-GEMMメタコマンドのサポート
> Llama 2、Llama 3、Mistral、Phi-3モデルの新しいRMSNorm正規化法
>グループとマルチクエリアテンションメカニズムとMistralをサポートするスライドウィンドウアテンション
>注意性能を向上させるための内部KVアップデート
>コンテキストステップのパフォーマンスを向上させるために8の倍数ではなくテンソルのGEMMをサポート
マイクロソフトが発売した生成型AI拡張であるORTのパフォーマンスベンチマークでは、NVIDIAはINT4とFP16の両方のデータ型で全体的に改善されたパフォーマンスを示しています。 Phi-3、Llama 3、Gemma、Mistralなど、LLM用の拡張機能に追加された最適化技術のおかげで、最大3倍のパフォーマンスが向上しました。
これらの機能強化に加えて、NVIDIAは強力なTensorRTおよびTensorRT-LLMファミリを通じて消費者AI PCスペースをリードしてきました。また、同社は、Tensor Coreなど、GPUに統合されたAIハードウェアに基づいたさまざまなソリューションを提供しています。
これらのソリューションには、ディストリビューションを変えるDLSS超解像度技術、NVIDIA ACE、RTX Remix、Omniverse、Broadcast、RTX Video、その他多くの技術が含まれます。 NVIDIAのGPUは、最大1300TOPSのAIコンピューティングを提供します。これは、今年リリースされる最速のチップ(100TOPSのみが予想される)よりはるかに先行しています。さらに、これらのPCには最新のNVIDIA RTX GPUが搭載されており、RTX AI PCプラットフォームをさらに活用し、消費者空間でAIセクターをさらに発展させます.
ソース: