XAI Elona Muska napoveduje Grok-1.5 Vision z multimodalno zmogljivostjo

Ikona časa branja 2 min. prebrati


Bralci pomagajo pri podpori MSpoweruser. Če kupujete prek naših povezav, lahko prejmemo provizijo. Ikona opisa orodja

Preberite našo stran za razkritje, če želite izvedeti, kako lahko pomagate MSPoweruser vzdrževati uredniško skupino Preberi več

Ključne opombe

  • XAI Elona Muska je napovedal Grok-1.5 Vision ali Grok-1.5V.
  • Grok-1.5V je prvi multimodalni model podjetja in bo kmalu na voljo prvim preizkuševalcem in obstoječim uporabnikom Grok.
  • Grok-1.5V lahko obdeluje besedilne in vizualne informacije.

Prejšnji mesec je Elon Musk nekaj dni za tem lansiral Grok-1.5 LLM Google je predstavil Gemini 1.5. Medtem ko je Muskov xAI trdil, da je njegov model blizu zmogljivosti GPT-4, nima multimodalne zmogljivosti. Vendar pa Grok-1.5 Vision, ki ga je nedavno objavilo podjetje, nima te omejitve, saj lahko obdeluje besedilne in vizualne informacije.

Kaj je Grok-1.5 Vision (Grok-1.5V) in kdaj bo na voljo?

Grok-1.5V je multimodalni model prve generacije xAI, ki želi povezati digitalni in fizični svet. "Grok prekaša svoje vrstnike v našem novem merilu uspešnosti RealWorldQA, ki meri razumevanje prostora v resničnem svetu," so sporočili iz podjetja blog post. Poleg tega lahko Grok-1.5V "obdeluje široko paleto vizualnih informacij, vključno z dokumenti, diagrami, grafikoni, posnetki zaslona in fotografijami."

Na primer, nekatere vznemirljive stvari, ki jih lahko počne, vključujejo pisanje kode iz diagrama, izračun kalorij, ustvarjanje pravljic za lahko noč na podlagi risb, pomoč pri razumevanju mema in drugo. xAI trdi, da je Grok-1.5V boljši od svojih konkurenčnih LLM-jev, vključno z GPT-4V, Claude 3Sonnet, Claude 3 Opus in Gemini Pro, v merilu uspešnosti RealWorldQA.

"Grok prekaša svoje vrstnike v našem novem merilu RealWorldQA, ki meri razumevanje prostora v resničnem svetu," je poudaril xAI.

Grok-1.5V trenutno ni na voljo, vendar bo kmalu na voljo prvim preizkuševalcem in obstoječim uporabnikom Grok kot predogled. Čeprav xAI ni navedel datuma lansiranja, je obljubljeno, da bo še izboljšal "multimodalno razumevanje" in "zmožnosti generiranja" ter prinesel izboljšave različnih modalitet, kot so slike, zvok in video.

Uporabniški forum

Sporočila 0