Appleov novi LLM: MM1 mogao bi smanjiti potrebu za višestrukim upitima za postizanje željenog rezultata

Ikona vremena čitanja 2 min. čitati


Čitatelji pomažu pri podršci MSpoweruser. Možda ćemo dobiti proviziju ako kupujete putem naših veza. Ikona opisa alata

Pročitajte našu stranicu za otkrivanje kako biste saznali kako možete pomoći MSPoweruseru da održi urednički tim Čitaj više

Ključne napomene

  • Appleov MM1 je novi AI model koji trenira na tekstualnim i slikovnim podacima, što potencijalno pokreće Siri 2.0.
  • MM1 koristi multimodalni pristup za postizanje boljih performansi i smanjenje potrebe za višestrukim upitima.
  • Jedinstvena arhitektura MM1 i model MoE omogućuju mu rad na uređajima poput iPhonea.
Zgrada jabuke

Apple je bio relativno tih o svom radu na velikim jezičnim modelima (LLM), ali novi istraživački rad sugerira da brzo sustižu. MM1 je nova metoda za obuku AI modela koji kombinira tekstualne i slikovne podatke, što bi moglo ubrzati obuku i smanjiti potrebu za višestrukim upitima za dobivanje željenog rezultata. Ovo dolazi nekoliko dana poslije Apple je preuzeo DarwinAI.

Što je MM1?

MM1 je obitelj AI modela, s najvećim koji doseže 30 milijardi parametara (manji od nekih konkurenata, ali još uvijek moćan). Parametri se odnose na numeričke vrijednosti koje model koristi za učenje i predstavljanje svijeta. Veći broj parametara općenito ukazuje na složeniji model koji može obraditi širi raspon zadataka i proizvesti nijansiranije rezultate.

Fokusira se na multimodalno učenje, što znači da može obraditi i razumjeti tekst i slike. Ovo bi mogao biti veliki korak naprijed za Siri, omogućujući joj da bolje razumije vaše zahtjeve i odgovori relevantnijim informacijama. Prošli mjesec, Apple je predstavio i AI manipulator slika.

Istraživači koji stoje iza MM1 tvrde da kombiniranje različitih vrsta podataka o treningu dovodi do boljih performansi. MM1 koristi a mješavina naslova slika, tekstualnih podataka i vizualnih odgovora na pitanja za obuku modela. To omogućuje MM1 izvršavanje zadataka kao što su opisi slika, vizualni odgovori na pitanja i razumijevanje prirodnog jezika.

MM1 koristi jedinstvenu arhitekturu s koderima veće rezolucije slike i drugačijim pristupom podacima prije obuke i označavanju. Također koristi model mješavine stručnjaka (MoE) za povećanje, a istovremeno održava niske zahtjeve za obradu, što znači da bi potencijalno mogao raditi na uređajima poput iPhonea i prijenosnih računala.

Istraživački rad ne spominje izričito Siri, ali usredotočenost na učinkovitost, minimalne upute i multimodalne mogućnosti nagovještava Appleov smjer za budućnost Siri. Ranije je a leaker je predložio pametniju Siri s ponudom pretplate na GenAI.

Kontakt Apple donosi druge LLM-ove poput Geminija na iPhone, čini se da Apple ima višestruki pristup napretku umjetne inteligencije.

more ovdje.

Korisnički forum

0 poruke