Gemini Ultra vs GPT 4: como o Google Gemini vence o OpenAI GPT-4 na maioria dos benchmarks

2 minutos. ler

Publicado em 6 de dezembro de 2023

publicado em 6 de dezembro de 2023

Os leitores ajudam a oferecer suporte ao MSpoweruser. Podemos receber uma comissão se você comprar através de nossos links.

O novo modelo de linguagem do Google, GeminiO principal modelo da OpenAI, Gemini Ultra, superou o GPT-4 da OpenAI em testes de benchmark abrangentes. Desde tarefas baseadas em texto até compreensão complexa de multimídia, Gemini demonstrou consistentemente um desempenho superior.

Desempenho baseado em texto:

Raciocínio em várias etapas (Big-Bench Hard): O Gemini Ultra ultrapassou o GPT-4, demonstrando sua capacidade de seguir instruções complexas e resolver problemas de múltiplas etapas.
Compreensão de leitura (DROP): Gêmeos se destacou na compreensão das nuances do texto, superando o GPT-4 na extração precisa de informações e na resposta a perguntas com base na leitura de trechos.
Raciocínio de bom senso para tarefas diárias (HellaSwag): Embora o GPT-4 tenha superado o Gemini nesta categoria, ambos os modelos demonstraram capacidades notáveis na aplicação do conhecimento do senso comum a situações cotidianas.

Processamento multimídia:

Tarefas relacionadas à imagem: Gemini passou em todos os testes envolvendo processamento de imagens, demonstrando capacidades superiores em raciocínio de nível universitário, compreensão natural de imagens, OCR, compreensão de documentos, análise de infográficos e raciocínio matemático em contextos visuais.
Processamento de vídeo: Gemini triunfou em dois testes relacionados a vídeos, destacando-se na captura de legendas em inglês e na resposta a perguntas em vídeo.
Processamento de áudio: Gemini superou os testes de áudio, demonstrando desempenho superior de tradução automática de fala e desempenho de reconhecimento.

No geral, o Gemini superou o GPT4, exceto no raciocínio de bom senso para tarefas diárias (HellaSwag).

A imagem é clara: o Gemini Ultra do Google se estabeleceu como o principal modelo de linguagem de grande porte, superando seu concorrente, o GPT-4, em diversas tarefas.

Mais informações SUA PARTICIPAÇÃO FAZ A DIFERENÇA.

Devesh Beri

Jornalista de Tecnologia

Estas são as coisas que me motivam - criar conteúdo informativo e útil, perseguir a minha paixão pelos desportos motorizados e pela música, participar em expedições, manter um estilo de vida saudável e passar tempo com o meu adorável gato Taco.