クロード 3.5 ソネットの「コンピュータの使用」機能は正直言って本当に奇妙に聞こえる

この機能は現在、開発者向け API で利用できます。

読書時間アイコン 2分。 読んだ


読者は MSpoweruser のサポートを支援します。私たちのリンクを通じて購入すると、手数料が発生する場合があります。 ツールチップアイコン

MSPoweruser の編集チームの維持にどのように貢献できるかについては、開示ページをお読みください。 続きを読む

キーノート

  • Anthropic は、画面を見つめてコンピューターを制御する「コンピューター使用」機能を備えた Claude 3.5 Sonnet をリリースしました。
  • 実験的な機能には制限とリスクがあります。
  • Claude 3.5 Haiku モデルも、テキストのみのバージョンとして今月後半に利用可能になる予定です。
クロード 3.5 ソネット、コンピュータの使用

アントロピックは最近、パブリックベータ版をリリースしました。 クロード 3.5 ソネット AI モデル。そして、アマゾンが支援するAI企業は「コンピューターの使用「これは基本的に、画面を見るだけでコンピューターを制御できるものです。

この機能は開発者向け API で利用できるようになりましたが、正直言って、かなり奇妙に聞こえます。MacBook で公開されたデモでは、Anthropic は AI を PC 上で人間のように動作するように指示できることを明らかにしています。つまり、画面を見たり、カーソルを動かしたり、ボタンをクリックしたり、テキストを入力したりといった操作を AI に実行させることができるのです。

マイクロソフト、OpenAI、Googleの同様のAIアシスタントは、まだ(CopilotやGeminiのような)ツールにユーザーのPCを完全に制御させる権限を与えていない。しかし、それほど遠くない昔、マイクロソフトは、次のようなシステムの特許を申請した。 舌を使ってPCを操作する.

アプリケーションによれば、目を動かしたり歯をタップしたりすることで文字を選択でき、文字を消すなどの複数のジェスチャーも可能とのこと。

Anthropic はまた、「コンピューターの使用」機能は、特にインターネットの閲覧に使用する場合、まだ完璧には程遠いと警告しています。また、スクロール、ドラッグ、ズームなどの操作はまだできません。同社は、この機能は「標準の API 機能やチャット インターフェースとは異なる独自のリスクをもたらす」と述べています。

別の発表では、アントロピックは クロード 3.5 俳句 モデル。Claude 3.5ファミリー全体で最速と評価されているHaikuは、コーディング、ツールの使用、推論において優れています。 OpenAIのo1モデル.

このモデルは、今月後半に Anthropic API、Amazon Bedrock、Google Cloud の Vertex AI 経由で利用可能になる予定で、最初はテキストのみのモデルとして提供され、その後画像入力も予定されています。

ユーザーフォーラム

0メッセージ