Por que esperar pelo Gemini Ultra quando você pode usar o GPT-4 Turbo com Vision por meio do serviço Azure OpenAI

Ícone de tempo de leitura 2 minutos. ler


Os leitores ajudam a oferecer suporte ao MSpoweruser. Podemos receber uma comissão se você comprar através de nossos links. Ícone de dica de ferramenta

Leia nossa página de divulgação para descobrir como você pode ajudar o MSPoweruser a sustentar a equipe editorial Saiba mais

OpenAI GPT-4 Turbo vs Gemini Ultra

OpenAI's GPT-4 Turbo com Visão é um grande modelo multimodal (LMM) que pode analisar imagens e fornecer respostas textuais a perguntas sobre elas. Este modelo avançado de IA multimodal inclui todos os recursos do GPT-4 Turbo, ao mesmo tempo que adiciona a capacidade de processar e analisar entradas de imagem. 

Hoje, Microsoft anunciou esse GPT-4 Turbo com Vision agora está disponível por meio do Azure OpenAI Service. Os clientes existentes do Azure OpenAI Service nas regiões Azure Leste da Austrália, Central da Suécia, Norte da Suíça e Oeste dos EUA agora podem acessar o serviço GPT-4 Turbo com Vision.

Juntamente com a disponibilidade do GPT-4 Turbo com Vision, a Microsoft está anunciando melhorias nos serviços de IA do Azure, permitindo funcionalidades avançadas.

  • Reconhecimento óptico de caracteres (OCR): Extrai texto de imagens, integrando-o ao prompt e imagem do usuário para enriquecer o contexto. 
  • Aterramento de objeto: aprimora as respostas de texto do GPT-4 Turbo com Vision, identificando e delineando objetos-chave nas imagens. 
  • Solicitações de vídeo: permite que o GPT-4 Turbo com Vision responda perguntas usando os quadros mais relevantes de um vídeo com base na solicitação do usuário. 
  • Serviço Azure OpenAI nos seus dados com imagens: Ao combinar GPT-4 Turbo com Vision, Azure AI Search e Azure AI Vision, as imagens agora podem ser adicionadas com dados de texto, utilizando pesquisa vetorial para desenvolver uma solução que se conecta aos dados do usuário, permitindo uma experiência de chat aprimorada.

O serviço GPT-4 Turbo com Vision on Azure OpenAI será cobrado com base no número de tokens de entrada e saída. Encontre os detalhes abaixo.

ModeloEntrada saída 
GPT-4 Turbo com Visão1US$ 0.01 por 1000 tokensUS$ 0.03 por 1000 tokens
+ Recursos complementares aprimorados para OCRUS$ 1.50 por 1000 transações
+ Recursos complementares aprimorados para Object GroundingUS$ 1.50 por 1000 transações
+ Recurso complementar aprimorado para incorporação de imagem “Adicione sua imagem”US$ 0.10 por 1000 transações
+ Recurso complementar aprimorado para prompts de vídeo integrando recuperação de vídeoUS$ 0.05 por minuto para indexação US$ 0.25 por 1000 transações2

No início desta semana, a equipe de pesquisa da Microsoft revelou que o modelo GPT-4 da OpenAI pode vencer o Google Gemini Ultra quando novas técnicas de prompt são usadas. Então, se você está esperando pelo Gemini Ultra, você definitivamente deveria experimentar o GPT-4 Turbo com Vision.

Mais sobre os tópicos: GPT-4 Turbo com Visão, microsoft, openAI