Microsoft julkistaa Phi-3-visionin, uuden multimodaalisen SLM:n laitteiden tekoälyskenaarioihin
1 min. lukea
Päivitetty
Lue ilmoitussivumme saadaksesi selville, kuinka voit auttaa MSPoweruseria ylläpitämään toimitustiimiä Lue lisää
Keskeiset huomautukset
- Phi-3-vision on 4.2B-parametrimalli, joka tukee yleisiä visuaalisia päättelytehtäviä ja kaavio-/kaavio-/taulukkopäättelyä
Microsoft tänään Build 2024:ssä laajeni sen Phi-3-perheen pienten kielimallien tekoälymallit uudella Phi-3-visionilla. Phi-3-vision on 4.2B-parametrimalli, joka tukee yleisiä visuaalisia päättelytehtäviä ja kaavio-/kaavio-/taulukkopäättelyä. Malli voi ottaa sekä kuvia että tekstiä syötteenä ja tulostaa tekstivastauksia.
Microsoft ilmoitti tänään myös Phi-3-minin yleisestä saatavuudesta Azure AI:n Models-as-a Service (MaaS) -tarjouksessa. Phi-3 mallit ovat saamassa vauhtia, koska ne ovat kustannustehokkaita ja optimoitu laitteella, reunalla, offline-päätelmissä ja latenssiin sidottuissa tekoälyskenaarioissa.
Phi-3-malleista saatujen uutisten lisäksi Microsoft ilmoitti uusista API-ominaisuuksista, jotka mahdollistavat multimodaalisen käyttökokemuksen. Azure AI Speechillä on nyt puheanalytiikka ja universaali käännös. Azure AI Searchin mukana tulee nyt huomattavasti enemmän tallennustilaa ja jopa 12-kertainen vektoriindeksin koko ilman lisäkustannuksia, mikä mahdollistaa suuren RAG-työkuorman mittakaavassa.
Käyttäjäfoorumi
0-viestit