Appleov novi LLM: MM1 mogao bi smanjiti potrebu za višestrukim upitima za postizanje željenog rezultata
2 min. čitati
Objavljeno na
Pročitajte našu stranicu za otkrivanje kako biste saznali kako možete pomoći MSPoweruseru da održi urednički tim Čitaj više
Ključne napomene
- Appleov MM1 je novi AI model koji trenira na tekstualnim i slikovnim podacima, što potencijalno pokreće Siri 2.0.
- MM1 koristi multimodalni pristup za postizanje boljih performansi i smanjenje potrebe za višestrukim upitima.
- Jedinstvena arhitektura MM1 i model MoE omogućuju mu rad na uređajima poput iPhonea.
Apple je bio relativno tih o svom radu na velikim jezičnim modelima (LLM), ali novi istraživački rad sugerira da brzo sustižu. MM1 je nova metoda za obuku AI modela koji kombinira tekstualne i slikovne podatke, što bi moglo ubrzati obuku i smanjiti potrebu za višestrukim upitima za dobivanje željenog rezultata. Ovo dolazi nekoliko dana poslije Apple je preuzeo DarwinAI.
Što je MM1?
MM1 je obitelj AI modela, s najvećim koji doseže 30 milijardi parametara (manji od nekih konkurenata, ali još uvijek moćan). Parametri se odnose na numeričke vrijednosti koje model koristi za učenje i predstavljanje svijeta. Veći broj parametara općenito ukazuje na složeniji model koji može obraditi širi raspon zadataka i proizvesti nijansiranije rezultate.
Fokusira se na multimodalno učenje, što znači da može obraditi i razumjeti tekst i slike. Ovo bi mogao biti veliki korak naprijed za Siri, omogućujući joj da bolje razumije vaše zahtjeve i odgovori relevantnijim informacijama. Prošli mjesec, Apple je predstavio i AI manipulator slika.
Istraživači koji stoje iza MM1 tvrde da kombiniranje različitih vrsta podataka o treningu dovodi do boljih performansi. MM1 koristi a mješavina naslova slika, tekstualnih podataka i vizualnih odgovora na pitanja za obuku modela. To omogućuje MM1 izvršavanje zadataka kao što su opisi slika, vizualni odgovori na pitanja i razumijevanje prirodnog jezika.
MM1 koristi jedinstvenu arhitekturu s koderima veće rezolucije slike i drugačijim pristupom podacima prije obuke i označavanju. Također koristi model mješavine stručnjaka (MoE) za povećanje, a istovremeno održava niske zahtjeve za obradu, što znači da bi potencijalno mogao raditi na uređajima poput iPhonea i prijenosnih računala.
Istraživački rad ne spominje izričito Siri, ali usredotočenost na učinkovitost, minimalne upute i multimodalne mogućnosti nagovještava Appleov smjer za budućnost Siri. Ranije je a leaker je predložio pametniju Siri s ponudom pretplate na GenAI.
Kontakt Apple donosi druge LLM-ove poput Geminija na iPhone, čini se da Apple ima višestruki pristup napretku umjetne inteligencije.
more ovdje.
Korisnički forum
0 poruke