Microsoft julkistaa Phi-3-visionin, uuden multimodaalisen SLM:n laitteiden tekoälyskenaarioihin

Etusivu » Uutiset

Lukuajan kuvake 1 min. lukea

Kalenterikuvake Päivitetty Voi 23, 2024

by Pradeep Viswav

päivitetty Voi 23, 2024

Lukijat auttavat tukemaan MSpoweruseria. Saatamme saada palkkion, jos ostat linkkien kautta.

Keskeiset huomautukset

Phi-3-vision on 4.2B-parametrimalli, joka tukee yleisiä visuaalisia päättelytehtäviä ja kaavio-/kaavio-/taulukkopäättelyä

Microsoft tänään Build 2024:ssä laajeni sen Phi-3-perheen pienten kielimallien tekoälymallit uudella Phi-3-visionilla. Phi-3-vision on 4.2B-parametrimalli, joka tukee yleisiä visuaalisia päättelytehtäviä ja kaavio-/kaavio-/taulukkopäättelyä. Malli voi ottaa sekä kuvia että tekstiä syötteenä ja tulostaa tekstivastauksia.

Microsoft ilmoitti tänään myös Phi-3-minin yleisestä saatavuudesta Azure AI:n Models-as-a Service (MaaS) -tarjouksessa. Phi-3 mallit ovat saamassa vauhtia, koska ne ovat kustannustehokkaita ja optimoitu laitteella, reunalla, offline-päätelmissä ja latenssiin sidottuissa tekoälyskenaarioissa.

Phi-3-malleista saatujen uutisten lisäksi Microsoft ilmoitti uusista API-ominaisuuksista, jotka mahdollistavat multimodaalisen käyttökokemuksen. Azure AI Speechillä on nyt puheanalytiikka ja universaali käännös. Azure AI Searchin mukana tulee nyt huomattavasti enemmän tallennustilaa ja jopa 12-kertainen vektoriindeksin koko ilman lisäkustannuksia, mikä mahdollistaa suuren RAG-työkuorman mittakaavassa.

Lisää aiheista: microsoft, Phi-3-näkemys

Pradeep Viswav

Ohjelmisto- ja palveluasiantuntija

Pradeep on tietojenkäsittelytieteen ja tekniikan tutkinnon suorittanut. Hän oli myös Microsoft Student Partner. Tällä hetkellä hän työskentelee johtavassa IT-yrityksessä.