Microsoft oznamuje Phi-3-vision, nový multimodální SLM pro scénáře umělé inteligence na zařízení

Ikona času čtení 1 min. číst


Čtenáři pomáhají podporovat MSpoweruser. Pokud nakoupíte prostřednictvím našich odkazů, můžeme získat provizi. Ikona popisku

Přečtěte si naši informační stránku a zjistěte, jak můžete pomoci MSPoweruser udržet redakční tým Více informací

Klíčové poznámky

  • Phi-3-vision je 4.2B parametrický model, který podporuje obecné úkoly vizuálního uvažování a uvažování v grafech/grafech/tabulkách

Na Build 2024, Microsoft dnes rozšířený jeho rodina malých jazykových modelů AI Phi-3 s novou vizí Phi-3. Phi-3-vision je 4.2B parametrický model, který podporuje obecné úlohy vizuálního uvažování a uvažování pomocí tabulek/grafů/tabulek. Model může přijímat obrázky i text jako vstupní a výstupní textové odpovědi.

Microsoft dnes také oznámil obecnou dostupnost Phi-3-mini v nabídce Models-as-a Service (MaaS) Azure AI. Modely Phi-3 nabývají na síle, protože jsou nákladově efektivní a optimalizované pro scénáře umělé inteligence na zařízení, na hraně, offline a vázané na latenci.

Kromě novinek o modelech Phi-3 společnost Microsoft oznámila nové funkce napříč rozhraními API, které umožňují multimodální zážitky. Azure AI Speech nyní obsahuje analýzu řeči a univerzální překlad. Azure AI Search nyní přichází s výrazně větším úložištěm a až 12násobným nárůstem velikosti vektorového indexu bez dalších nákladů, aby bylo možné provádět velké úlohy RAG ve velkém měřítku.

Uživatelské fórum

0 zprávy