NVIDIA と Google が提携して、NVIDIA GPU 上で新しい Google Gemma を最適化

ホーム » ニュース

2分。読んだ

上で公開 2024 年 2 月 22 日

by デベシュ・ベリ

上の公表 2024 年 2 月 22 日

読者は MSpoweruser のサポートを支援します。私たちのリンクを通じて購入すると、手数料が発生する場合があります。

キーノート

Microsoft は NVIDIA を捨て、Google は新しい AI モデルを最適化するために NVIDIA を採用します。
NVIDIA の TensorRT-LLM は、ローカル PC を含むさまざまなプラットフォーム上で Google の Gemma を高速化します。
開発者は、特定のニーズに合わせて Gemma を微調整および展開するためのツールにアクセスできます。

Microsoft は最近、NVIDIA GPU から自社のカスタムチップを選択する決定を発表しましたが、Google は逆のアプローチをとり、NVIDIA と協力して新しい軽量言語モデルである Gemma を NVIDIA GPU 上で最適化しました。

ジェマ 　 軽量言語モデル Googleが開発。膨大な計算リソースを必要とする従来の大規模言語モデル (LLM) とは異なり、Gemma は優れた機能を提供しながら、より小さいサイズ (2 億および 7 億のパラメーターバージョン) を誇ります。

このコラボレーションは、Gemma のアクセシビリティとパフォーマンスを大幅に向上させ、Gemma をさまざまなプラットフォームでより高速かつ広く利用できるようにすることを目的としています。

このオープンソースライブラリは LLM 推論を最適化し、データセンター、クラウド環境、さらには NVIDIA RTX GPU を搭載したパーソナルコンピューターの NVIDIA GPU でのパフォーマンスの高速化を可能にします。このコラボレーションは、世界中で 100 億台を超える NVIDIA RTX GPU と、H100 および今後の H200 GPU を搭載したクラウドプラットフォームを対象としています。

NeMo フレームワークや TensorRT-LLM を含む NVIDIA の AI Enterprise スイートにより、開発者は特定のユースケースに合わせて Gemma を微調整して導入できるようになります。

ユーザーは、NVIDIA AI Playground を通じて Gemma と直接対話できるようになり、まもなく Chat with RTX デモを通じて Gemma と直接対話できるようになり、データを使用してチャットボットをパーソナライズできるようになります。

Microsoft、NVIDIAから距離を置く, NVIDIA GPU 上でテクノロジーを最適化するという Google の動きは、両者のパートナーシップが強化される可能性を示唆しています。これは AI と言語モデリングのさらなる進歩につながり、開発者とユーザーの両方に利益をもたらす可能性があります。

さらに、RTX GPU を介したローカル処理に焦点を当てることで、ユーザーはデータとプライバシーをより詳細に制御できるようになり、クラウドベースの LLM サービスに関連する懸念に対処できる可能性があります。

その他こちら.

トピックの詳細: ジェマ

デベシュ・ベリ

技術ジャーナリスト

有益で役立つコンテンツを作成すること、モータースポーツと音楽への情熱を追求すること、遠征に参加すること、健康的なライフスタイルを維持すること、そして愛猫のタコスと時間を過ごすこと、これらが私を動かす原動力です。