GPT-4 Turbo com Vision agora está disponível na API

As solicitações do Vision agora também podem usar o modo JSON e chamadas de função.

Ícone de tempo de leitura 2 minutos. ler


Os leitores ajudam a oferecer suporte ao MSpoweruser. Podemos receber uma comissão se você comprar através de nossos links. Ícone de dica de ferramenta

Leia nossa página de divulgação para descobrir como você pode ajudar o MSPoweruser a sustentar a equipe editorial Saiba mais

Notas chave

  • OpenAI lança GPT-4 Turbo atualizado com melhor desempenho e processamento de visão.
  • GPT-4 Turbo possui uma enorme base de conhecimento e custos de processamento mais baratos.
  • OpenAI provoca tecnologia do futuro: Voice Engine para fala realista e GPT-5 para raciocínio avançado.
OpenAI GPT-4 Turbo

OpenAI revelou a próxima geração de seu modelo de linguagem com o lançamento de GPT-4 Turbo com Visão através de sua API. Esta versão atualizada melhorou recursos como Modo JSON e chamada de função para processamento de dados visuais. O modelo também promete aumento de desempenho e está programado para integração com o popular ChatGPT.

O que é GPT-4 Turbo?

GPT-4 Turbo é uma potência multimodal capaz de lidar com entradas de texto e imagem. Este modelo utiliza sua vasta base de conhecimento e habilidades de raciocínio para fornecer resultados. OpenAI revelou pela primeira vez o GPT-4 Turbo em novembro passado, destacando seu conhecimento expandido (até abril de 2023) e uma grande janela de contexto de 128k; isso permite aos usuários adicionar mais de 300 páginas de texto em um único prompt.

Um benefício real do GPT-4 Turbo reside no seu desempenho otimizado, traduzindo-se em reduções substanciais de custos para os usuários. Em comparação com o modelo anterior, os tokens de entrada são agora três vezes mais baratos, enquanto os tokens de saída são oferecidos pela metade do preço. Esta atualização torna o GPT-4 Turbo uma solução eficiente e econômica.

Enquanto o GPT-4 Turbo ocupa o centro do palco, a OpenAI também provocou seu próximo Motor de Voz, que é capaz de gerar uma fala com som natural apenas a partir da entrada de texto e uma breve amostra de áudio (apenas 15 segundos a partir de agora). Esta tecnologia, no entanto, permanece fora do alcance do público em geral.

A OpenAI sugeriu ainda a chegada de seu próximo grande modelo, GPT-5, que se diz ser "materialmente melhor." E você sabia que a Microsoft também provocou por engano o GPT-5 Turbo na assinatura do Copilot Pro?