XAI Elon Musk mengumumkan Grok-1.5 Vision, dengan kemampuan multimoda

Ikon waktu membaca 2 menit Baca


Pembaca membantu dukungan MSpoweruser. Kami mungkin mendapat komisi jika Anda membeli melalui tautan kami. Ikon Keterangan Alat

Baca halaman pengungkapan kami untuk mengetahui bagaimana Anda dapat membantu MSPoweruser mempertahankan tim editorial Baca lebih lanjut

Catatan kunci

  • XAI Elon Musk telah mengumumkan Grok-1.5 Vision atau Grok-1.5V.
  • Grok-1.5V adalah model multimoda pertama perusahaan dan akan segera tersedia untuk penguji awal dan pengguna Grok.
  • Grok-1.5V dapat memproses informasi teks dan visual.

Bulan lalu, Elon Musk meluncurkan Grok-1.5 LLM beberapa hari setelahnya Google meluncurkan Gemini 1.5. Meskipun xAI Musk mengklaim bahwa modelnya mendekati kinerja GPT-4, ia tidak memiliki kemampuan multimoda. Namun, Grok-1.5 Vision yang baru-baru ini diumumkan perusahaan tidak memiliki batasan tersebut, karena dapat memproses informasi teks dan visual.

Apa itu Grok-1.5 Vision (Grok-1.5V) dan kapan akan tersedia?

Grok-1.5V adalah model multimoda generasi pertama xAI yang bertujuan untuk menghubungkan dunia digital dan fisik. “Grok mengungguli rekan-rekannya dalam tolok ukur RealWorldQA baru kami yang mengukur pemahaman spasial dunia nyata,” kata perusahaan itu dalam sebuah pernyataan. posting blog. Selain itu, Grok-1.5V dapat “memproses berbagai macam informasi visual, termasuk dokumen, diagram, bagan, tangkapan layar, dan foto.”

Misalnya, beberapa hal menarik yang dapat dilakukannya antara lain menulis kode dari diagram, menghitung kalori, membuat cerita pengantar tidur berdasarkan gambar, membantu Anda memahami meme, dan banyak lagi. xAI mengklaim bahwa Grok-1.5V berkinerja lebih baik daripada LLM pesaingnya, termasuk GPT-4V, Claude 3Sonnet, Claude 3 Opus, dan Gemini Pro, dalam benchmark RealWorldQA.

“Grok mengungguli rekan-rekannya dalam tolok ukur RealWorldQA baru kami yang mengukur pemahaman spasial dunia nyata,” xAI menyoroti.

Grok-1.5V saat ini tidak tersedia, tetapi akan segera hadir untuk penguji awal dan pengguna Grok yang sudah ada sebagai pratinjau. Meskipun xAI belum menentukan tanggal peluncurannya, xAI berjanji untuk lebih memajukan “pemahaman multimodal” dan “kemampuan generasi” serta membawa peningkatan pada berbagai modalitas seperti gambar, audio, dan video.

forum pengguna

Pesan 0