Google、性能を大幅に強化したGemini 1.5モデルを発表

読書時間アイコン 2分。 読んだ


読者は MSpoweruser のサポートを支援します。私たちのリンクを通じて購入すると、手数料が発生する場合があります。 ツールチップアイコン

MSPoweruser の編集チームの維持にどのように貢献できるかについては、開示ページをお読みください。 続きを読む

Google ジェミニ 1.5

先週の Gemini Ultra モデルのリリースに続き、Google は本日 発表の 最新モデル Gemini 1.5 の発売。 Gemini 1.5 モデルはさまざまな側面で劇的な改善をもたらし、Google は Gemini 1.5 モデルがはるかに少ない計算能力で 1.0 Ultra と同等の品質を達成すると主張しています。さらに、Gemini 1.5 モデルは、最大 1 万個のトークンを一貫して処理することもできます。これは、これまでの大規模基礎モデルでサポートされている最長のコンテキスト ウィンドウであることに注意することが重要です。

Gemini 1.5 の機能:

このモデルは、専門家混合 (MoE) 技術を使用した新しいアーキテクチャに基づいており、入力に応じてニューラル ネットワークの最も関連性の高い部分を選択的にアクティブにすることができます。

Gemini 1.5 Pro は中型のマルチモーダル モデルで、テキスト、画像、ビデオ、オーディオ、コードなどのさまざまな種類のデータを処理できます。これは、同社のこれまでで最大のモデルである Gemini 1.0 Ultra と同様のレベルのパフォーマンスを実現しながら、拡張性とコスト効率がより優れています。また、長期コンテキストの理解における画期的な実験機能も備えており、これにより、膨大な量の情報を一度に処理して推論することができます。

改良された性能: テキスト、コード、画像、オーディオ、ビデオ評価の包括的なパネルでテストしたところ、大規模言語モデル (LLM) の開発に使用されるベンチマークの 1.5% で 1.0 Pro が 87 Pro を上回りました。また、同じベンチマークで 1.0 Ultra と比較した場合、ほぼ同様のレベルでパフォーマンスを発揮します。

より長いコード ブロック: 1.5 Pro は、より長いコード ブロックにわたって、より関連性の高い問題解決タスクを実行できます。 100,000 行を超えるコードを含むプロンプトが表示された場合、サンプルをより適切に検討し、役立つ変更を提案し、コードのさまざまな部分がどのように機能するかについて説明することができます。

マルチモーダルな改善: 1.5 Pro は、ビデオなどのさまざまなモダリティに対する高度な理解と推論のタスクを実行できます。

Gemini 1.5 の可用性:

Google は本日、Gemini 1.5 Pro の限定プレビューを開発者および企業顧客向けにリリースしました。 AIスタジオ および 頂点AI。 Google は間もなく、標準の 128,000 コンテキスト ウィンドウから始まり、最大 1 万トークンまでの価格帯を明らかにする予定です。初期のテスターは、テスト期間中、1 万トークンのコンテキスト ウィンドウを無料で試すことができます。 Gemini 1.5 Pro のテストに興味がある場合は、次のことができます。 今すぐサインアップ AIスタジオで。

トピックの詳細: 双子座, ジェミニ1.5, グーグル