Google tillkännager Gemini 1.5-modell med dramatiskt förbättrad prestanda

Lästid ikon 2 min. läsa


Läsare hjälper till att stödja MSpoweruser. Vi kan få en provision om du köper via våra länkar. Verktygstipsikon

Läs vår informationssida för att ta reda på hur du kan hjälpa MSPoweruser upprätthålla redaktionen Läs mer

Google Gemini 1.5

Hot på hälarna av att släppa Gemini Ultra-modellen förra veckan, Google idag meddelade lanseringen av sin nyaste modell, Gemini 1.5. Gemini 1.5-modellen kommer att leverera dramatiska förbättringar över ett antal dimensioner och Google hävdar att Gemini 1.5-modellen uppnår jämförbar kvalitet med 1.0 Ultra med mycket mindre beräkningskapacitet. Dessutom kan Gemini 1.5-modellen också behandla upp till 1 miljon tokens konsekvent. Det är viktigt att notera att detta är det längsta sammanhangsfönstret som stöds av någon storskalig grundmodell hittills.

Gemini 1.5 funktioner:

Modellen är baserad på en ny arkitektur som använder en Mixture-of-Experts (MoE)-teknik, som gör att den selektivt kan aktivera de mest relevanta delarna av sitt neurala nätverk beroende på input.

Gemini 1.5 Pro är en mellanstor multimodal modell, vilket innebär att den kan hantera olika typer av data som text, bilder, videor, ljud och kod. Den kan prestera på en liknande nivå som Gemini 1.0 Ultra, företagets hittills största modell, samtidigt som den är mer skalbar och kostnadseffektiv. Den har också en banbrytande experimentell förmåga i förståelse av långa sammanhang, vilket gör att den kan bearbeta och resonera om stora mängder information på en gång.

Förbättrad prestanda: När den testas på en omfattande panel av text-, kod-, bild-, ljud- och videoutvärderingar överträffar 1.5 Pro 1.0 Pro på 87 % av de riktmärken som används för att utveckla våra stora språkmodeller (LLM). Och jämfört med 1.0 Ultra på samma riktmärken, presterar den på en i stort sett liknande nivå.

Längre kodblock: 1.5 Pro kan utföra mer relevanta problemlösningsuppgifter över längre kodblock. När du får en uppmaning med mer än 100,000 XNUMX rader kod kan den bättre resonera över exempel, föreslå användbara modifieringar och ge förklaringar om hur olika delar av koden fungerar.

Multimodala förbättringar: 1.5 Pro kan utföra mycket sofistikerade förståelse- och resonemangsuppgifter för olika modaliteter, inklusive video.

Tillgänglighet för Gemini 1.5:

Google släppte idag den begränsade förhandsvisningen av Gemini 1.5 Pro till utvecklare och företagskunder via AI Studio och Vertex AI. Google kommer snart att avslöja prisnivåer som börjar vid standardfönstret på 128,000 1 sammanhang och skalar upp till 1 miljon tokens. Tidiga testare kommer att kunna prova kontextfönstret på 1.5 miljon token utan kostnad under testperioden. Om du är intresserad av att testa Gemini XNUMX Pro kan du Anmäl dig nu i AI Studio.

Mer om ämnena: gemini, Gemini 1.5, google