Applov novi LLM: MM1 bi lahko zmanjšal potrebo po večkratnih pozivih za doseganje želenega rezultata

Ikona časa branja 2 min. prebrati


Bralci pomagajo pri podpori MSpoweruser. Če kupujete prek naših povezav, lahko prejmemo provizijo. Ikona opisa orodja

Preberite našo stran za razkritje, če želite izvedeti, kako lahko pomagate MSPoweruser vzdrževati uredniško skupino Preberi več

Ključne opombe

  • Applov MM1 je nov model umetne inteligence, ki se usposablja na besedilnih in slikovnih podatkih ter potencialno poganja Siri 2.0.
  • MM1 uporablja multimodalni pristop za doseganje boljše učinkovitosti in zmanjšanje potrebe po več pozivih.
  • Edinstvena arhitektura in model MoE MM1 omogočata delovanje na napravah, kot so iPhone.
Gradnja Apple

Apple je bil razmeroma tih o svojem delu na področju velikih jezikovnih modelov (LLM), vendar nova raziskava kaže, da hitro dohitevajo. MM1 je nova metoda za usposabljanje modelov umetne inteligence, ki združuje besedilne in slikovne podatke, kar bi lahko pospešilo usposabljanje in zmanjšalo potrebo po večkratnih pozivih za doseganje želenega rezultata. To pride nekaj dni kasneje Apple je kupil DarwinAI.

Kaj je MM1?

MM1 je družina modelov AI, pri čemer največji dosega 30 milijard parametrov (manjši od nekaterih konkurentov, a še vedno zmogljiv). Parametri se nanašajo na številčne vrednosti, ki jih model uporablja za učenje in predstavljanje sveta. Večje število parametrov na splošno kaže na bolj zapleten model, ki lahko obravnava širši obseg nalog in ustvari bolj niansirane rezultate.

Osredotoča se na multimodalno učenje, kar pomeni, da lahko obdeluje in razume besedilo in slike. To bi lahko bil velik korak naprej za Siri, ki ji bo omogočil, da bolje razume vaše zahteve in se odzove z ustreznejšimi informacijami. Prejšnji mesec, Apple je predstavil tudi slikovni manipulator AI.

Raziskovalci, ki stojijo za MM1, trdijo, da združevanje različnih vrst podatkov o usposabljanju vodi do boljše učinkovitosti. MM1 uporablja a mešanica napisov slik, besedilnih podatkov in vizualnih odgovorov na vprašanja za usposabljanje modela. To omogoča MM1, da izvaja naloge, kot so podnapisi, vizualni odgovori na vprašanja in razumevanje naravnega jezika.

MM1 uporablja edinstveno arhitekturo s kodirniki višje ločljivosti slike in drugačnim pristopom k predhodnemu usposabljanju in označevanju podatkov. Uporablja tudi model mešanice strokovnjakov (MoE) za povečanje obsega, hkrati pa ohranja nizke zahteve za obdelavo, kar pomeni, da bi lahko deloval na napravah, kot so telefoni iPhone in prenosniki.

Raziskovalni članek Sirija izrecno ne omenja, vendar osredotočenost na učinkovitost, minimalne pozive in multimodalne zmogljivosti namiguje na Applovo usmeritev za prihodnost Sirija. Prej, a Leaker je predlagal pametnejšo Siri z naročniškimi ponudbami GenAI.

z Apple prinaša druge LLM-je, kot je Gemini, v iPhone, se zdi, da Apple uporablja večstranski pristop k napredku AI.

Več tukaj.

Uporabniški forum

Sporočila 0