Applov novi LLM: MM1 bi lahko zmanjšal potrebo po večkratnih pozivih za doseganje želenega rezultata

Domov » Novice

Ikona časa branja 2 min. prebrati

Ikona koledarja Objavljeno dne Marec 18, 2024

by Devesh Beri

Objavljeno dne Marec 18, 2024

Dajte v skupno rabo ta članek

Izboljšajte ta vodnik

Bralci pomagajo pri podpori MSpoweruser. Če kupujete prek naših povezav, lahko prejmemo provizijo.

Ključne opombe

Applov MM1 je nov model umetne inteligence, ki se usposablja na besedilnih in slikovnih podatkih ter potencialno poganja Siri 2.0.
MM1 uporablja multimodalni pristop za doseganje boljše učinkovitosti in zmanjšanje potrebe po več pozivih.
Edinstvena arhitektura in model MoE MM1 omogočata delovanje na napravah, kot so iPhone.

Apple je bil razmeroma tih o svojem delu na področju velikih jezikovnih modelov (LLM), vendar nova raziskava kaže, da hitro dohitevajo. MM1 je nova metoda za usposabljanje modelov umetne inteligence, ki združuje besedilne in slikovne podatke, kar bi lahko pospešilo usposabljanje in zmanjšalo potrebo po večkratnih pozivih za doseganje želenega rezultata. To pride nekaj dni kasneje Apple je kupil DarwinAI.

Kaj je MM1?

MM1 je družina modelov AI, pri čemer največji dosega 30 milijard parametrov (manjši od nekaterih konkurentov, a še vedno zmogljiv). Parametri se nanašajo na številčne vrednosti, ki jih model uporablja za učenje in predstavljanje sveta. Večje število parametrov na splošno kaže na bolj zapleten model, ki lahko obravnava širši obseg nalog in ustvari bolj niansirane rezultate.

Osredotoča se na multimodalno učenje, kar pomeni, da lahko obdeluje in razume besedilo in slike. To bi lahko bil velik korak naprej za Siri, ki ji bo omogočil, da bolje razume vaše zahteve in se odzove z ustreznejšimi informacijami. Prejšnji mesec, Apple je predstavil tudi slikovni manipulator AI.

Raziskovalci, ki stojijo za MM1, trdijo, da združevanje različnih vrst podatkov o usposabljanju vodi do boljše učinkovitosti. MM1 uporablja a mešanica napisov slik, besedilnih podatkov in vizualnih odgovorov na vprašanja za usposabljanje modela. To omogoča MM1, da izvaja naloge, kot so podnapisi, vizualni odgovori na vprašanja in razumevanje naravnega jezika.

MM1 uporablja edinstveno arhitekturo s kodirniki višje ločljivosti slike in drugačnim pristopom k predhodnemu usposabljanju in označevanju podatkov. Uporablja tudi model mešanice strokovnjakov (MoE) za povečanje obsega, hkrati pa ohranja nizke zahteve za obdelavo, kar pomeni, da bi lahko deloval na napravah, kot so telefoni iPhone in prenosniki.

Raziskovalni članek Sirija izrecno ne omenja, vendar osredotočenost na učinkovitost, minimalne pozive in multimodalne zmogljivosti namiguje na Applovo usmeritev za prihodnost Sirija. Prej, a Leaker je predlagal pametnejšo Siri z naročniškimi ponudbami GenAI.

z Apple prinaša druge LLM-je, kot je Gemini, v iPhone, se zdi, da Apple uporablja večstranski pristop k napredku AI.

Več tukaj.

Devesh Beri

Tehnični novinar

To so stvari, ki me motivirajo – ustvarjanje informativne in koristne vsebine, uresničevanje moje strasti do motošporta in glasbe, sodelovanje v ekspedicijah, ohranjanje zdravega načina življenja in preživljanje časa z mojo čudovito mačko Taco.

Uporabniški forum

Sporočila 0

Razvrsti po:

Pustite Odgovori preklicati odgovor