Microsoft napoveduje Phi-3-vision, nov multimodalni SLM za scenarije umetne inteligence v napravi

Domov » Novice

1 min. prebrati

Posodobljeno dne Maj 23, 2024

by Pradeep Viswav

posodobljeno dne Maj 23, 2024

Dajte v skupno rabo ta članek

Izboljšajte ta vodnik

Bralci pomagajo pri podpori MSpoweruser. Če kupujete prek naših povezav, lahko prejmemo provizijo.

Ključne opombe

Phi-3-vision je model parametrov 4.2B, ki podpira naloge splošnega vizualnega razmišljanja in sklepanje grafikonov/grafov/tabel

Na Build 2024, Microsoft danes razširiti svojo družino Phi-3 majhnih jezikovnih modelov AI z novim Phi-3-vision. Phi-3-vision je model parametrov 4.2B, ki podpira naloge splošnega vizualnega razmišljanja in sklepanje grafikonov/grafov/tabel. Model lahko sprejme slike in besedilo kot vhod ter izhodne besedilne odgovore.

Microsoft je danes objavil tudi splošno razpoložljivost Phi-3-mini v ponudbi Models-as-a Service (MaaS) Azure AI. Modeli Phi-3 pridobivajo zagon, saj so stroškovno učinkoviti in optimizirani za scenarije umetne inteligence, vezane na napravo, rob, sklepanje brez povezave in zakasnitev.

Poleg novic o modelih Phi-3 je Microsoft napovedal nove funkcije v API-jih za omogočanje multimodalnih izkušenj. Azure AI Speech ima zdaj analitiko govora in univerzalno prevajanje. Iskanje z umetno inteligenco Azure je zdaj opremljeno z znatno povečanim prostorom za shranjevanje in do 12-kratnim povečanjem velikosti vektorskega indeksa brez dodatnih stroškov, kar omogoča velike delovne obremenitve RAG v velikem obsegu.