A Google bemutatja a Gemini 1.5 modellt drámaian megnövelt teljesítménnyel

Olvasási idő ikonra 2 perc olvas


Az olvasók segítenek az MSpoweruser támogatásában. Kaphatunk jutalékot, ha a linkjeinken keresztül vásárol. Eszköztipp ikon

Olvassa el közzétételi oldalunkat, hogy megtudja, hogyan segítheti az MSPowerusert a szerkesztői csapat fenntartásában Tovább

Google Gemini 1.5

A múlt héten a Gemini Ultra modell megjelenése, ma a Google bejelentés legújabb modellje, a Gemini 1.5 bemutatása. A Gemini 1.5 modell drámai fejlődést fog elérni számos dimenzióban, és a Google azt állítja, hogy a Gemini 1.5 modell az 1.0 Ultra-hoz hasonló minőséget ér el, sokkal kisebb számítási kapacitás mellett. Ezenkívül a Gemini 1.5 modell akár 1 millió tokent is képes folyamatosan feldolgozni. Fontos megjegyezni, hogy ez a leghosszabb kontextusablak, amelyet az eddigi nagyszabású alapozási modell támogat.

A Gemini 1.5 jellemzői:

A modell egy újszerű architektúrán alapul, amely a Mixture-of-Experts (MoE) technikát használja, amely lehetővé teszi, hogy a bemenettől függően szelektíven aktiválja neurális hálózatának legfontosabb részeit.

A Gemini 1.5 Pro egy közepes méretű multimodális modell, ami azt jelenti, hogy különböző típusú adatokat, például szöveget, képeket, videókat, hangot és kódot képes kezelni. A Gemini 1.0 Ultra-hoz, a cég eddigi legnagyobb modelljéhez hasonló teljesítményre képes, ugyanakkor skálázhatóbb és költséghatékonyabb. Áttörő kísérleti képességgel is rendelkezik a hosszú kontextusok megértésében, amely lehetővé teszi, hogy egyszerre hatalmas mennyiségű információt dolgozzon fel és érveljen.

Jobb teljesítmény: Ha egy átfogó szöveg-, kód-, kép-, hang- és videóértékelési panelen tesztelték, az 1.5 Pro a nagy nyelvi modelljeink (LLM) fejlesztéséhez használt benchmarkok 1.0%-án felülmúlja az 87 Pro-t. És összehasonlítva az 1.0 Ultra-val ugyanazon a benchmarkon, nagyjából hasonló szinten teljesít.

Hosszabb kódblokkok: Az 1.5 Pro relevánsabb problémamegoldási feladatokat tud végrehajtani hosszabb kódblokkok között. Ha több mint 100,000 XNUMX kódsort tartalmazó promptot adunk, az jobban tud indokolni a példákon keresztül, hasznos módosításokat javasol, és magyarázatot ad a kód különböző részeinek működésére.

Multimodális fejlesztések: Az 1.5 Pro rendkívül kifinomult megértési és érvelési feladatokat tud végrehajtani különböző módokon, beleértve a videót is.

A Gemini 1.5 elérhetősége:

A Google ma kiadta a Gemini 1.5 Pro korlátozott előzetesét a fejlesztőknek és a vállalati ügyfeleknek ezen keresztül AI Stúdió és a Vertex AI. A Google hamarosan nyilvánosságra hozza azokat az árképzési szinteket, amelyek a szabványos 128,000 1-es kontextusablaktól kezdődnek, és 1 millió tokenig terjednek. A korai tesztelők a tesztelési időszakban ingyenesen kipróbálhatják az 1.5 millió token környezeti ablakot. Ha érdekli a Gemini XNUMX Pro tesztelése, megteheti Iratkozzon fel most az AI Stúdióban.

Bővebben a témákról: Ikrek, Gemini 1.5, google