ハオのガジェット工房

※当サイトでは一部アフィリエイト広告を利用しています。自作PC、スマホを中心とした最新情報をお届けします。

NVIDIA、最新ドライバでGeForce RTX GPU、RTX PC、ワークステーションAI性能を3倍向上

  NVIDIAは、最新のR555ドライバリリースにより、GeForce RTX GPUおよびRTX AI PCプラットフォームのAI性能をさらに向上させました。

NVIDIAのGeForce RTX GPUおよびRTX PCは、あらゆる分野で最速のAI性能を提供し、最新のドライバーで3倍に向上しました。

 

    今日、Microsoft Buildでは、NVIDIAはGeForce RTX GPU、ワークステーション、およびPCを含むRTXプラットフォームで利用可能なさまざまな新しいAIパフォーマンスの最適化を発表しました。

 

    新しい最適化は、特に最新のGenerative AI体験をサポートするさまざまなLLM(ラージ言語モデル)を対象としています。最新のR555ドライバを使用したNVIDIAのRTX GPUおよびAI PCプラットフォームは、ORT(ONNXランタイム)とDirectMLを介して最大3倍の高速AI性能を提供します。これら2つのツールは、Windows PC上でAIモデルをローカルで実行するために使用されます。

 

それに加えて、WebNNはDirectMLを介してRTXに加速されました。これは、Web開発者が新しいAIモデルを展開できるアプリケーションプログラミングインターフェースです。マイクロソフトは、PyTorchにDirectMLサポートを追加するとともに、RTX GPUのパフォーマンスをさらに加速するためにNVIDIAと協力しています。以下は、新しいR555ドライバがGeForce RTX GPUおよびRTX PCに提供する機能の完全なリストです。

 

 > LLMのINT4ウェイト専用量子化を処理するためのDQ-GEMMメタコマンドのサポート

 > Llama 2、Llama 3、Mistral、Phi-3モデルの新しいRMSNorm正規化法

 >グループとマルチクエリアテンションメカニズムとMistralをサポートするスライドウィンドウアテンション

 >注意性能を向上させるための内部KVアップデート

 >コンテキストステップのパフォーマンスを向上させるために8の倍数ではなくテンソルのGEMMをサポート

 

 

  マイクロソフトが発売した生成型AI拡張であるORTのパフォーマンスベンチマークでは、NVIDIAはINT4とFP16の両方のデータ型で全体的に改善されたパフォーマンスを示しています。 Phi-3、Llama 3、Gemma、Mistralなど、LLM用の拡張機能に追加された最適化技術のおかげで、最大3倍のパフォーマンスが向上しました。

    これらの機能強化に加えて、NVIDIAは強力なTensorRTおよびTensorRT-LLMファミリを通じて消費者AI PCスペースをリードしてきました。また、同社は、Tensor Coreなど、GPUに統合されたAIハードウェアに基づいたさまざまなソリューションを提供しています。

    これらのソリューションには、ディストリビューションを変えるDLSS超解像度技術、NVIDIA ACE、RTX Remix、Omniverse、Broadcast、RTX Video、その他多くの技術が含まれます。 NVIDIAのGPUは、最大1300TOPSのAIコンピューティングを提供します。これは、今年リリースされる最速のチップ(100TOPSのみが予想される)よりはるかに先行しています。さらに、これらのPCには最新のNVIDIA RTX GPUが搭載されており、RTX AI PCプラットフォームをさらに活用し、消費者空間でAIセクターをさらに発展させます.

 

ソース:

https://wccftech.com/nvidia-boosts-ai-performance-3x-geforce-rtx-gpus-rtx-pc-rtx-workstations-latest-driver/