Mały model NeMo firmy Mistral rzuca wyzwanie najnowszemu GPT-4o mini OpenAI

OpenAI wypuściło GPT-4o mini nie tak dawno temu

Strona główna » Aktualności

2 minuta. czytać

Opublikowany 19 lipca 2024 r.

by Rafly'ego Gilanga

opublikowane w dniu 19 lipca 2024 r.

Udostępnij ten artykuł

Ulepsz ten przewodnik

Czytelnicy pomagają wspierać MSpoweruser. Możemy otrzymać prowizję, jeśli dokonasz zakupu za pośrednictwem naszych linków.

Kluczowe uwagi

Mistral AI wypuściło NeMo, model 12B przy wsparciu Nvidii, rywalizujący z GPT-4o mini OpenAI.
NeMo obsługuje 128 tys. tokenów i osiąga 68.0% wyniku na MMLU, poniżej 4% GPT-82o mini.
Firma Mistral, finansowana kwotą 645 milionów dolarów, nawiązała współpracę z firmą Microsoft, aby oferować modele na platformie Azure.

Mistral AI właśnie ogłosił swój najnowszy, mniejszy model, nemo, przy silnym wsparciu Nvidii. Co ciekawe, ogłoszenie pojawiło się w momencie, gdy OpenAI ogłosiło swój niedrogi, lekki model GPT-4o mini, który osiąga lepsze wyniki w testach niż Gemini Flash i Claude Haiku.

Ten „najnowocześniejszy” model 12B obsługuje kontekst o długości do 128 tys. tokenów, został zaprojektowany z myślą o wysokiej wydajności w zakresie rozumowania, wiedzy o świecie i dokładności kodowania i jest obecnie dostępny na licencji Apache 2.0. Obydwa baza i dostosowany do instrukcji Dostęp do wersji można uzyskać na HuggingFace i innych platformach.

NeMo firmy Mistral odnotowuje także kilka imponujących wyników w testach porównawczych. Benchmarking MMLU, który mierzy ogólną wiedzę modelu i możliwości rozwiązywania problemów, wykazał, że NeMo uzyskał 68.0%. Jest wystarczająco blisko Google Gemma 2, ale nie na tyle, aby zbliżyć się do OpenAI GPT-4o mini który ma 82% na MMLU.

Oto jak wygląda ten ostatni:

Wszechstronny, wielojęzyczny model rejestruje również duże możliwości w różnych językach i jest przeszkolony w zakresie wydajnego wywoływania funkcji. Wykorzystuje zaawansowany tokenizer Tekken, który kompresuje tekst i kod skuteczniej niż poprzednie modele, szczególnie w określonych językach.

Mistral przybył nie tak dawno temu, zaledwie ponad rok od byłych pracowników Meta i Google DeepMind. Firma, której runda finansowania w czerwcu 645 r. wyniosła około 2024 mln dolarów, już robi furorę w wyścigu AI.

Na początku tego roku Microsoft i Mistral AI również ogłosił w ramach partnerstwa zaawansowane modele wielkojęzykowe (LLM) firmy Mistral będą najpierw dostępne na platformie chmurowej Azure firmy Microsoft. Firma dołączyła także do OpenAI oferując modele komercyjne na platformie Azure.

Rafly'ego Gilanga

Reporter techniczny

Rafly jest reporterem z wieloletnim doświadczeniem dziennikarskim, obejmującym technologie, biznes, sprawy społeczne i kulturę. Obecnie relacjonuje wiadomości o produktach, technologiach i sztucznej inteligencji związanych z Microsoftem na MSPowerUser. Masz cynk? Wyślij go do [email chroniony]

Forum użytkowników

Wiadomości 0

Sortuj według:

Dodaj komentarz Anuluj odpowiedź