Mały model NeMo firmy Mistral rzuca wyzwanie najnowszemu GPT-4o mini OpenAI
OpenAI wypuściło GPT-4o mini nie tak dawno temu
2 minuta. czytać
Opublikowany
Przeczytaj naszą stronę z informacjami, aby dowiedzieć się, jak możesz pomóc MSPoweruser w utrzymaniu zespołu redakcyjnego Czytaj więcej
Kluczowe uwagi
- Mistral AI wypuściło NeMo, model 12B przy wsparciu Nvidii, rywalizujący z GPT-4o mini OpenAI.
- NeMo obsługuje 128 tys. tokenów i osiąga 68.0% wyniku na MMLU, poniżej 4% GPT-82o mini.
- Firma Mistral, finansowana kwotą 645 milionów dolarów, nawiązała współpracę z firmą Microsoft, aby oferować modele na platformie Azure.
Mistral AI właśnie ogłosił swój najnowszy, mniejszy model, nemo, przy silnym wsparciu Nvidii. Co ciekawe, ogłoszenie pojawiło się w momencie, gdy OpenAI ogłosiło swój niedrogi, lekki model GPT-4o mini, który osiąga lepsze wyniki w testach niż Gemini Flash i Claude Haiku.
Ten „najnowocześniejszy” model 12B obsługuje kontekst o długości do 128 tys. tokenów, został zaprojektowany z myślą o wysokiej wydajności w zakresie rozumowania, wiedzy o świecie i dokładności kodowania i jest obecnie dostępny na licencji Apache 2.0. Obydwa baza i dostosowany do instrukcji Dostęp do wersji można uzyskać na HuggingFace i innych platformach.
NeMo firmy Mistral odnotowuje także kilka imponujących wyników w testach porównawczych. Benchmarking MMLU, który mierzy ogólną wiedzę modelu i możliwości rozwiązywania problemów, wykazał, że NeMo uzyskał 68.0%. Jest wystarczająco blisko Google Gemma 2, ale nie na tyle, aby zbliżyć się do OpenAI GPT-4o mini który ma 82% na MMLU.
Oto jak wygląda ten ostatni:
Wszechstronny, wielojęzyczny model rejestruje również duże możliwości w różnych językach i jest przeszkolony w zakresie wydajnego wywoływania funkcji. Wykorzystuje zaawansowany tokenizer Tekken, który kompresuje tekst i kod skuteczniej niż poprzednie modele, szczególnie w określonych językach.
Mistral przybył nie tak dawno temu, zaledwie ponad rok od byłych pracowników Meta i Google DeepMind. Firma, której runda finansowania w czerwcu 645 r. wyniosła około 2024 mln dolarów, już robi furorę w wyścigu AI.
Na początku tego roku Microsoft i Mistral AI również ogłosił w ramach partnerstwa zaawansowane modele wielkojęzykowe (LLM) firmy Mistral będą najpierw dostępne na platformie chmurowej Azure firmy Microsoft. Firma dołączyła także do OpenAI oferując modele komercyjne na platformie Azure.
Forum użytkowników
Wiadomości 0