Možda ćete morati pričekati još malo da dobijete opciju učitavanja slika za Bingovu multimodalnu značajku
2 min. čitati
Objavljeno na
Pročitajte našu stranicu za otkrivanje kako biste saznali kako možete pomoći MSPoweruseru da održi urednički tim Čitaj više
OpenAI je službeno objavio GPT-4, a Microsoft je otkrio da je model "prilagođen za pretraživanje". Dio ovog uzbudljivog otkrića je multimodalna sposobnost modela, koja mu omogućuje obradu slika. Međutim, ova je značajka još uvijek ograničena čak i na Bingu. Štoviše, učitavanje slika da bi se iskoristila ova značajka moglo bi biti daleko, kao što je nagovijestio jedan od Microsoftovih zaposlenika.
Multimodalnost je najveći vrhunac najnovijeg modela OpenAI-ja. I dok je GPT-4 već dostupan putem pretplatnici ChatGPT Plus, značajka je još u fazi testiranja, što je čini nedostupnom svima. Bez obzira na to, OpenAI je u svom nedavnom postu na blogu pokazao kako bi multimodalnost funkcionirala u GPT-4, koji u osnovi može opisati i interpretirati učitane slike.
Wow Bing sada zapravo može opisivati slike, sada kada zna da koristi GPT-4!
byu/BroskiPlaysYT inBing
Čini se da je ova multimodalna mogućnost sada dostupna na novi Bing, iako ne u potpunosti. Za početak, korisnici mogu zatražiti od Bing Chata da opiše slike pomoću poveznica na slike preuzete s weba, a on će generirati odgovor. Osim toga, chatbot će sada uključiti slike u svoj proces, pogotovo ako to zatražite.
S druge strane, opcija izravnog prijenosa slike koju Bing opisuje ili analizira još uvijek nije dostupna. Dolazak ove opcije nedavno je pokrenuo korisnik na X / Twitter Mikhailu Parakhinu, Microsoftovom voditelju oglašavanja i web usluga, koji je sugerirao da to za sada nije prioritet tvrtke.
Puno je skuplje, prvo moramo proširiti trenutnu funkcionalnost. Sve je u uvođenju više GPU-a.
— Mikhail Parakhin (@MParakhin) Ožujak 14, 2023
Kako bi ovo bilo moguće, Parakhin je primijetio potrebu za "više GPU-a" i rekao da je to "mnogo skuplje". U nedavnoj prijaviti, Microsoft je otkrio da je već potrošio stotine milijuna dolara za izgradnju ChatGPT superračunala povezivanjem tisuća Nvidia GPU-a na svojoj Azure platformi za računalstvo u oblaku. Uz ovo, ako se Parakhinove riječi shvate ozbiljno, Microsoft bi mogao potrošiti više kako bi u potpunosti uveo multimodalnu značajku u Bing. A na temelju onoga što je Parakhin rekao, to je moguće, samo ne danas.