Microsoft julkistaa Phi-3-visionin, uuden multimodaalisen SLM:n laitteiden tekoälyskenaarioihin

Etusivu » uutiset

1 min. lukea

Päivitetty Voi 23, 2024

by Pradeep Viswav

päivitetty Voi 23, 2024

Jaa tämä artikkeli

Paranna tätä ohjetta

Lukijat auttavat tukemaan MSpoweruseria. Saatamme saada palkkion, jos ostat linkkien kautta.

Keskeiset huomautukset

Phi-3-vision on 4.2B-parametrimalli, joka tukee yleisiä visuaalisia päättelytehtäviä ja kaavio-/kaavio-/taulukkopäättelyä

Microsoft tänään Build 2024:ssä laajeni sen Phi-3-perheen pienten kielimallien tekoälymallit uudella Phi-3-visionilla. Phi-3-vision on 4.2B-parametrimalli, joka tukee yleisiä visuaalisia päättelytehtäviä ja kaavio-/kaavio-/taulukkopäättelyä. Malli voi ottaa sekä kuvia että tekstiä syötteenä ja tulostaa tekstivastauksia.

Microsoft ilmoitti tänään myös Phi-3-minin yleisestä saatavuudesta Azure AI:n Models-as-a Service (MaaS) -tarjouksessa. Phi-3 mallit ovat saamassa vauhtia, koska ne ovat kustannustehokkaita ja optimoitu laitteella, reunalla, offline-päätelmissä ja latenssiin sidottuissa tekoälyskenaarioissa.

Phi-3-malleista saatujen uutisten lisäksi Microsoft ilmoitti uusista API-ominaisuuksista, jotka mahdollistavat multimodaalisen käyttökokemuksen. Azure AI Speechillä on nyt puheanalytiikka ja universaali käännös. Azure AI Searchin mukana tulee nyt huomattavasti enemmän tallennustilaa ja jopa 12-kertainen vektoriindeksin koko ilman lisäkustannuksia, mikä mahdollistaa suuren RAG-työkuorman mittakaavassa.

Pradeep Viswav

Ohjelmisto- ja palveluasiantuntija

Pradeep on tietojenkäsittelytieteen ja tekniikan tutkinnon suorittanut. Hän oli myös Microsoft Student Partner. Tällä hetkellä hän työskentelee johtavassa IT-yrityksessä.

Käyttäjäfoorumi

0-viestit

Järjestä:

Jätä vastaus