GPT-4 Turbo com Vision agora está disponível na API

As solicitações do Vision agora também podem usar o modo JSON e chamadas de função.

Ícone de tempo de leitura 2 minutos. ler

Ícone do calendário Publicado em 10 de abril de 2024

publicado em 10 de abril de 2024

Os leitores ajudam a oferecer suporte ao MSpoweruser. Podemos receber uma comissão se você comprar através de nossos links.

Notas chave

OpenAI lança GPT-4 Turbo atualizado com melhor desempenho e processamento de visão.
GPT-4 Turbo possui uma enorme base de conhecimento e custos de processamento mais baratos.
OpenAI provoca tecnologia do futuro: Voice Engine para fala realista e GPT-5 para raciocínio avançado.

OpenAI revelou a próxima geração de seu modelo de linguagem com o lançamento de GPT-4 Turbo com Visão através de sua API. Esta versão atualizada melhorou recursos como Modo JSON e chamada de função para processamento de dados visuais. O modelo também promete aumento de desempenho e está programado para integração com o popular ChatGPT.

Modelo GPT-4 Turbo bastante aprimorado, disponível agora na API e implementado no ChatGPT. https://t.co/HMihypFusV
- OpenAI (@ OpenAI) 9 de abril de 2024

O que é GPT-4 Turbo?

GPT-4 Turbo é uma potência multimodal capaz de lidar com entradas de texto e imagem. Este modelo utiliza sua vasta base de conhecimento e habilidades de raciocínio para fornecer resultados. OpenAI revelou pela primeira vez o GPT-4 Turbo em novembro passado, destacando seu conhecimento expandido (até abril de 2023) e uma grande janela de contexto de 128k; isso permite aos usuários adicionar mais de 300 páginas de texto em um único prompt.

Um benefício real do GPT-4 Turbo reside no seu desempenho otimizado, traduzindo-se em reduções substanciais de custos para os usuários. Em comparação com o modelo anterior, os tokens de entrada são agora três vezes mais baratos, enquanto os tokens de saída são oferecidos pela metade do preço. Esta atualização torna o GPT-4 Turbo uma solução eficiente e econômica.

Enquanto o GPT-4 Turbo ocupa o centro do palco, a OpenAI também provocou seu próximo Motor de Voz, que é capaz de gerar uma fala com som natural apenas a partir da entrada de texto e uma breve amostra de áudio (apenas 15 segundos a partir de agora). Esta tecnologia, no entanto, permanece fora do alcance do público em geral.

A OpenAI sugeriu ainda a chegada de seu próximo grande modelo, GPT-5, que se diz ser "materialmente melhor." E você sabia que a Microsoft também provocou por engano o GPT-5 Turbo na assinatura do Copilot Pro?

Devesh Beri

Jornalista de Tecnologia

Estas são as coisas que me motivam - criar conteúdo informativo e útil, perseguir a minha paixão pelos desportos motorizados e pela música, participar em expedições, manter um estilo de vida saudável e passar tempo com o meu adorável gato Taco.