Google ogłasza model Gemini 1.5 o znacznie zwiększonej wydajności

Ikona czasu czytania 2 minuta. czytać

Ikona kalendarza Opublikowany 15 lutego 2024 r.

opublikowane w dniu 15 lutego 2024 r.

Czytelnicy pomagają wspierać MSpoweruser. Możemy otrzymać prowizję, jeśli dokonasz zakupu za pośrednictwem naszych linków.

Zaraz po wydaniu w zeszłym tygodniu modelu Gemini Ultra, Google już dziś ogłosił premiera najnowszego modelu Gemini 1.5. Model Gemini 1.5 zapewni radykalną poprawę w wielu wymiarach, a Google twierdzi, że model Gemini 1.5 osiąga jakość porównywalną do 1.0 Ultra przy znacznie mniejszej mocy obliczeniowej. Ponadto model Gemini 1.5 może również przetwarzać konsekwentnie do 1 miliona tokenów. Należy zauważyć, że jest to najdłuższe okno kontekstowe obsługiwane przez jakikolwiek model podstawowy na dużą skalę.

Funkcje Gemini 1.5:

Model opiera się na nowatorskiej architekturze wykorzystującej technikę Mixture-of-Experts (MoE), która umożliwia selektywne aktywowanie najbardziej odpowiednich części sieci neuronowej w zależności od sygnału wejściowego.

Gemini 1.5 Pro to średniej wielkości model multimodalny, co oznacza, że może obsługiwać różne typy danych, takie jak tekst, obrazy, filmy, dźwięk i kod. Może działać na poziomie podobnym do Gemini 1.0 Ultra, największego dotychczas modelu firmy, a jednocześnie jest bardziej skalowalny i opłacalny. Posiada również przełomowe możliwości eksperymentalne w zakresie rozumienia długiego kontekstu, co umożliwia przetwarzanie i wnioskowanie o ogromnych ilościach informacji za jednym razem.

Poprawiona wydajność: Testowany na kompleksowym panelu oceny tekstu, kodu, obrazu, dźwięku i wideo, wersja 1.5 Pro przewyższa wersję 1.0 Pro w 87% testów porównawczych używanych do opracowywania naszych dużych modeli językowych (LLM). W porównaniu z wersją 1.0 Ultra w tych samych testach wydajność jest na zasadniczo podobnym poziomie.

Dłuższe bloki kodu: Wersja 1.5 Pro może wykonywać bardziej odpowiednie zadania związane z rozwiązywaniem problemów w dłuższych blokach kodu. Jeśli zostanie wyświetlony monit zawierający ponad 100,000 XNUMX wierszy kodu, będzie on w stanie lepiej przedstawić przykłady, zasugerować przydatne modyfikacje i wyjaśnić, jak działają różne części kodu.

Ulepszenia multimodalne: Wersja 1.5 Pro może wykonywać bardzo skomplikowane zadania polegające na zrozumieniu i rozumowaniu w przypadku różnych modalności, w tym wideo.

Dostępność Gemini 1.5:

Firma Google udostępniła dziś ograniczoną wersję zapoznawczą Gemini 1.5 Pro dla programistów i klientów korporacyjnych za pośrednictwem Studio AI i Wierzchołek AI. Google wkrótce ujawni poziomy cenowe rozpoczynające się od standardowego okna kontekstowego 128,000 1 i skalowane do 1 miliona tokenów. Pierwsi testerzy będą mogli bezpłatnie wypróbować okno kontekstowe zawierające 1.5 milion tokenów w okresie testowym. Jeśli jesteś zainteresowany przetestowaniem Gemini XNUMX Pro, możesz to zrobić Zapisz się teraz w AI Studio.

Więcej na tematy: Bliźnięta, Gemini 1.5, google

Pradeepa Viswava

Ekspert ds. oprogramowania i usług

Pradeep jest absolwentem informatyki i inżynierii. Był także partnerem studenckim firmy Microsoft. Obecnie pracuje w wiodącej firmie informatycznej.