Google ogłasza model Gemini 1.5 o znacznie zwiększonej wydajności
2 minuta. czytać
Opublikowany
Przeczytaj naszą stronę z informacjami, aby dowiedzieć się, jak możesz pomóc MSPoweruser w utrzymaniu zespołu redakcyjnego Czytaj więcej
Zaraz po wydaniu w zeszłym tygodniu modelu Gemini Ultra, Google już dziś ogłosił premiera najnowszego modelu Gemini 1.5. Model Gemini 1.5 zapewni radykalną poprawę w wielu wymiarach, a Google twierdzi, że model Gemini 1.5 osiąga jakość porównywalną do 1.0 Ultra przy znacznie mniejszej mocy obliczeniowej. Ponadto model Gemini 1.5 może również przetwarzać konsekwentnie do 1 miliona tokenów. Należy zauważyć, że jest to najdłuższe okno kontekstowe obsługiwane przez jakikolwiek model podstawowy na dużą skalę.
Funkcje Gemini 1.5:
Model opiera się na nowatorskiej architekturze wykorzystującej technikę Mixture-of-Experts (MoE), która umożliwia selektywne aktywowanie najbardziej odpowiednich części sieci neuronowej w zależności od sygnału wejściowego.
Gemini 1.5 Pro to średniej wielkości model multimodalny, co oznacza, że może obsługiwać różne typy danych, takie jak tekst, obrazy, filmy, dźwięk i kod. Może działać na poziomie podobnym do Gemini 1.0 Ultra, największego dotychczas modelu firmy, a jednocześnie jest bardziej skalowalny i opłacalny. Posiada również przełomowe możliwości eksperymentalne w zakresie rozumienia długiego kontekstu, co umożliwia przetwarzanie i wnioskowanie o ogromnych ilościach informacji za jednym razem.
Poprawiona wydajność: Testowany na kompleksowym panelu oceny tekstu, kodu, obrazu, dźwięku i wideo, wersja 1.5 Pro przewyższa wersję 1.0 Pro w 87% testów porównawczych używanych do opracowywania naszych dużych modeli językowych (LLM). W porównaniu z wersją 1.0 Ultra w tych samych testach wydajność jest na zasadniczo podobnym poziomie.
Dłuższe bloki kodu: Wersja 1.5 Pro może wykonywać bardziej odpowiednie zadania związane z rozwiązywaniem problemów w dłuższych blokach kodu. Jeśli zostanie wyświetlony monit zawierający ponad 100,000 XNUMX wierszy kodu, będzie on w stanie lepiej przedstawić przykłady, zasugerować przydatne modyfikacje i wyjaśnić, jak działają różne części kodu.
Ulepszenia multimodalne: Wersja 1.5 Pro może wykonywać bardzo skomplikowane zadania polegające na zrozumieniu i rozumowaniu w przypadku różnych modalności, w tym wideo.
Dostępność Gemini 1.5:
Firma Google udostępniła dziś ograniczoną wersję zapoznawczą Gemini 1.5 Pro dla programistów i klientów korporacyjnych za pośrednictwem Studio AI i Wierzchołek AI. Google wkrótce ujawni poziomy cenowe rozpoczynające się od standardowego okna kontekstowego 128,000 1 i skalowane do 1 miliona tokenów. Pierwsi testerzy będą mogli bezpłatnie wypróbować okno kontekstowe zawierające 1.5 milion tokenów w okresie testowym. Jeśli jesteś zainteresowany przetestowaniem Gemini XNUMX Pro, możesz to zrobić Zapisz się teraz w AI Studio.