Google oznamuje model Gemini 1.5 s výrazně vyšším výkonem

Ikona času čtení 2 min. číst


Čtenáři pomáhají podporovat MSpoweruser. Pokud nakoupíte prostřednictvím našich odkazů, můžeme získat provizi. Ikona popisku

Přečtěte si naši informační stránku a zjistěte, jak můžete pomoci MSPoweruser udržet redakční tým Dozvědět se více

Google Gemini 1.5

Společnost Google dnes šlape na paty vydání modelu Gemini Ultra minulý týden oznámila, uvedení svého nejnovějšího modelu Gemini 1.5. Model Gemini 1.5 přinese dramatická vylepšení v řadě dimenzí a Google tvrdí, že model Gemini 1.5 dosahuje kvality srovnatelné s 1.0 Ultra s mnohem menší výpočetní kapacitou. Model Gemini 1.5 navíc dokáže konzistentně zpracovat až 1 milion tokenů. Je důležité poznamenat, že se jedná o nejdelší kontextové okno, které dosud podporuje jakýkoli rozsáhlý model základů.

Vlastnosti Gemini 1.5:

Model je založen na nové architektuře, která využívá techniku ​​Mixture-of-Experts (MoE), která mu umožňuje selektivně aktivovat nejdůležitější části své neuronové sítě v závislosti na vstupu.

Gemini 1.5 Pro je středně velký multimodální model, což znamená, že zvládne různé typy dat, jako je text, obrázky, videa, zvuk a kód. Může fungovat na podobné úrovni jako Gemini 1.0 Ultra, dosud největší model společnosti, a přitom je škálovatelnější a nákladově efektivnější. Vyznačuje se také průlomovými experimentálními schopnostmi v porozumění dlouhých souvislostí, které mu umožňují zpracovat a uvažovat o obrovském množství informací najednou.

Zlepšený výkon: Při testování na komplexním panelu hodnocení textu, kódu, obrázků, zvuku a videa předčí 1.5 Pro 1.0 Pro v 87 % benchmarků používaných pro vývoj našich velkých jazykových modelů (LLM). A ve srovnání s 1.0 Ultra ve stejných benchmarcích funguje na velmi podobné úrovni.

Delší bloky kódu: 1.5 Pro může provádět relevantnější úlohy při řešení problémů v delších blocích kódu. Když dostanete výzvu s více než 100,000 XNUMX řádky kódu, může to lépe zdůvodnit příklady, navrhnout užitečné úpravy a poskytnout vysvětlení o tom, jak různé části kódu fungují.

Multimodální vylepšení: 1.5 Pro může provádět vysoce sofistikované úlohy porozumění a uvažování pro různé modality, včetně videa.

Dostupnost Gemini 1.5:

Google dnes vydal omezenou ukázku Gemini 1.5 Pro vývojářům a podnikovým zákazníkům prostřednictvím AI Studio  a  Vrcholová AI. Google brzy odhalí cenové úrovně, které začínají na standardním kontextovém okně 128,000 1 a rozšiřují se až na 1 milion tokenů. První testeři si budou moci během testovacího období zdarma vyzkoušet kontextové okno s 1.5 milionem tokenů. Pokud máte zájem otestovat Gemini XNUMX Pro, můžete zaregistrujte se hned teď v AI Studiu.

Více o tématech: Blíženci, Gemini 1.5, Google