Microsoft julkistaa Phi-3-visionin, uuden multimodaalisen SLM:n laitteiden tekoälyskenaarioihin

Lukuajan kuvake 1 min. lukea


Lukijat auttavat tukemaan MSpoweruseria. Saatamme saada palkkion, jos ostat linkkien kautta. Työkaluvihje-kuvake

Lue ilmoitussivumme saadaksesi selville, kuinka voit auttaa MSPoweruseria ylläpitämään toimitustiimiä Lue lisää

Keskeiset huomautukset

  • Phi-3-vision on 4.2B-parametrimalli, joka tukee yleisiä visuaalisia päättelytehtäviä ja kaavio-/kaavio-/taulukkopäättelyä

Microsoft tänään Build 2024:ssä laajeni sen Phi-3-perheen pienten kielimallien tekoälymallit uudella Phi-3-visionilla. Phi-3-vision on 4.2B-parametrimalli, joka tukee yleisiä visuaalisia päättelytehtäviä ja kaavio-/kaavio-/taulukkopäättelyä. Malli voi ottaa sekä kuvia että tekstiä syötteenä ja tulostaa tekstivastauksia.

Microsoft ilmoitti tänään myös Phi-3-minin yleisestä saatavuudesta Azure AI:n Models-as-a Service (MaaS) -tarjouksessa. Phi-3 mallit ovat saamassa vauhtia, koska ne ovat kustannustehokkaita ja optimoitu laitteella, reunalla, offline-päätelmissä ja latenssiin sidottuissa tekoälyskenaarioissa.

Phi-3-malleista saatujen uutisten lisäksi Microsoft ilmoitti uusista API-ominaisuuksista, jotka mahdollistavat multimodaalisen käyttökokemuksen. Azure AI Speechillä on nyt puheanalytiikka ja universaali käännös. Azure AI Searchin mukana tulee nyt huomattavasti enemmän tallennustilaa ja jopa 12-kertainen vektoriindeksin koko ilman lisäkustannuksia, mikä mahdollistaa suuren RAG-työkuorman mittakaavassa.

Lisää aiheista: microsoft, Phi-3-näkemys