Gemini Ultra vs GPT 4: Cum Google Gemini bate OpenAI GPT-4 în majoritatea benchmark-urilor

Pictograma timp de citire 2 min. citit


Cititorii ajută la sprijinirea MSpoweruser. Este posibil să primim un comision dacă cumpărați prin link-urile noastre. Pictograma Tooltip

Citiți pagina noastră de dezvăluire pentru a afla cum puteți ajuta MSPoweruser să susțină echipa editorială Afla mai multe

Noul model de limbă Google, GeminiModelul de top al lui, Gemini Ultra, a depășit performanța OpenAI GPT-4 în testele de referință cuprinzătoare. De la sarcini bazate pe text la înțelegere multimedia complexă, Gemini a demonstrat constant performanțe superioare.

Performanță bazată pe text:

  • Raționament în mai mulți pași (Big-Bench Hard): Gemini Ultra a depășit GPT-4, arătându-și capacitatea de a urma instrucțiuni complexe și de a rezolva probleme în mai mulți pași.
  • Înțelegerea lecturii (DROP): Gemenii au excelat în înțelegerea nuanțelor textului, depășind GPT-4 în extragerea cu acuratețe a informațiilor și răspunsul la întrebări bazate pe citirea pasajelor.
  • Raționament de bun simț pentru sarcinile de zi cu zi (HellaSwag): În timp ce GPT-4 i-a devansat pe Gemeni în această categorie, ambele modele au demonstrat capacități remarcabile în aplicarea cunoștințelor de bun simț în situațiile de zi cu zi.

Procesare multimedia:

  • Sarcini legate de imagine: Gemenii au trecut la toate testele care implică procesarea imaginilor, demonstrând capacități superioare în raționamentul la nivel de facultate, înțelegerea naturală a imaginii, OCR, înțelegerea documentelor, analiza infografică și raționamentul matematic în contexte vizuale.
  • Procesare video: Gemenii au triumfat în două teste legate de videoclipuri, excelând la captarea subtitrărilor în limba engleză și la răspunsurile la întrebări video.
  • Procesare audio: Gemenii au măturat testele audio, demonstrând performanțe superioare de traducere automată a vorbirii și recunoaștere.

În general, Gemeni a depășit GPT4, cu excepția raționamentului de bun simț pentru sarcinile de zi cu zi (HellaSwag).

Imaginea este clară: Google Gemini Ultra s-a impus ca model de limbă mare de frunte, depășind concurentul său, GPT-4, în diferite sarcini. 

Mai multe informatii aici.

Forumul utilizatorilor

0 mesaje