Microsoft napoveduje Phi-3-vision, nov multimodalni SLM za scenarije umetne inteligence v napravi
1 min. prebrati
Posodobljeno dne
Preberite našo stran za razkritje, če želite izvedeti, kako lahko pomagate MSPoweruser vzdrževati uredniško skupino Preberi več
Ključne opombe
- Phi-3-vision je model parametrov 4.2B, ki podpira naloge splošnega vizualnega razmišljanja in sklepanje grafikonov/grafov/tabel
Na Build 2024, Microsoft danes razširiti svojo družino Phi-3 majhnih jezikovnih modelov AI z novim Phi-3-vision. Phi-3-vision je model parametrov 4.2B, ki podpira naloge splošnega vizualnega razmišljanja in sklepanje grafikonov/grafov/tabel. Model lahko sprejme slike in besedilo kot vhod ter izhodne besedilne odgovore.
Microsoft je danes objavil tudi splošno razpoložljivost Phi-3-mini v ponudbi Models-as-a Service (MaaS) Azure AI. Modeli Phi-3 pridobivajo zagon, saj so stroškovno učinkoviti in optimizirani za scenarije umetne inteligence, vezane na napravo, rob, sklepanje brez povezave in zakasnitev.
Poleg novic o modelih Phi-3 je Microsoft napovedal nove funkcije v API-jih za omogočanje multimodalnih izkušenj. Azure AI Speech ima zdaj analitiko govora in univerzalno prevajanje. Iskanje z umetno inteligenco Azure je zdaj opremljeno z znatno povečanim prostorom za shranjevanje in do 12-kratnim povečanjem velikosti vektorskega indeksa brez dodatnih stroškov, kar omogoča velike delovne obremenitve RAG v velikem obsegu.
Uporabniški forum
Sporočila 0