Microsoft napoveduje Phi-3-vision, nov multimodalni SLM za scenarije umetne inteligence v napravi

Ikona časa branja 1 min. prebrati


Bralci pomagajo pri podpori MSpoweruser. Če kupujete prek naših povezav, lahko prejmemo provizijo. Ikona opisa orodja

Preberite našo stran za razkritje, če želite izvedeti, kako lahko pomagate MSPoweruser vzdrževati uredniško skupino Preberi več

Ključne opombe

  • Phi-3-vision je model parametrov 4.2B, ki podpira naloge splošnega vizualnega razmišljanja in sklepanje grafikonov/grafov/tabel

Na Build 2024, Microsoft danes razširiti svojo družino Phi-3 majhnih jezikovnih modelov AI z novim Phi-3-vision. Phi-3-vision je model parametrov 4.2B, ki podpira naloge splošnega vizualnega razmišljanja in sklepanje grafikonov/grafov/tabel. Model lahko sprejme slike in besedilo kot vhod ter izhodne besedilne odgovore.

Microsoft je danes objavil tudi splošno razpoložljivost Phi-3-mini v ponudbi Models-as-a Service (MaaS) Azure AI. Modeli Phi-3 pridobivajo zagon, saj so stroškovno učinkoviti in optimizirani za scenarije umetne inteligence, vezane na napravo, rob, sklepanje brez povezave in zakasnitev.

Poleg novic o modelih Phi-3 je Microsoft napovedal nove funkcije v API-jih za omogočanje multimodalnih izkušenj. Azure AI Speech ima zdaj analitiko govora in univerzalno prevajanje. Iskanje z umetno inteligenco Azure je zdaj opremljeno z znatno povečanim prostorom za shranjevanje in do 12-kratnim povečanjem velikosti vektorskega indeksa brez dodatnih stroškov, kar omogoča velike delovne obremenitve RAG v velikem obsegu.

Uporabniški forum

Sporočila 0