Por que esperar pelo Gemini Ultra quando você pode usar o GPT-4 Turbo com Vision por meio do serviço Azure OpenAI

Ícone de tempo de leitura 2 minutos. ler

Ícone do calendário Publicado em 14 de dezembro de 2023

publicado em 14 de dezembro de 2023

Os leitores ajudam a oferecer suporte ao MSpoweruser. Podemos receber uma comissão se você comprar através de nossos links.

OpenAI's GPT-4 Turbo com Visão é um grande modelo multimodal (LMM) que pode analisar imagens e fornecer respostas textuais a perguntas sobre elas. Este modelo avançado de IA multimodal inclui todos os recursos do GPT-4 Turbo, ao mesmo tempo que adiciona a capacidade de processar e analisar entradas de imagem.

Hoje, Microsoft anunciou esse GPT-4 Turbo com Vision agora está disponível por meio do Azure OpenAI Service. Os clientes existentes do Azure OpenAI Service nas regiões Azure Leste da Austrália, Central da Suécia, Norte da Suíça e Oeste dos EUA agora podem acessar o serviço GPT-4 Turbo com Vision.

Juntamente com a disponibilidade do GPT-4 Turbo com Vision, a Microsoft está anunciando melhorias nos serviços de IA do Azure, permitindo funcionalidades avançadas.

Reconhecimento óptico de caracteres (OCR): Extrai texto de imagens, integrando-o ao prompt e imagem do usuário para enriquecer o contexto.
Aterramento de objeto: aprimora as respostas de texto do GPT-4 Turbo com Vision, identificando e delineando objetos-chave nas imagens.
Solicitações de vídeo: permite que o GPT-4 Turbo com Vision responda perguntas usando os quadros mais relevantes de um vídeo com base na solicitação do usuário.
Serviço Azure OpenAI nos seus dados com imagens: Ao combinar GPT-4 Turbo com Vision, Azure AI Search e Azure AI Vision, as imagens agora podem ser adicionadas com dados de texto, utilizando pesquisa vetorial para desenvolver uma solução que se conecta aos dados do usuário, permitindo uma experiência de chat aprimorada.

O serviço GPT-4 Turbo com Vision on Azure OpenAI será cobrado com base no número de tokens de entrada e saída. Encontre os detalhes abaixo.

Modelo	Entrada	saída
GPT-4 Turbo com Visão¹	US$ 0.01 por 1000 tokens	US$ 0.03 por 1000 tokens
+ Recursos complementares aprimorados para OCR	US$ 1.50 por 1000 transações
+ Recursos complementares aprimorados para Object Grounding	US$ 1.50 por 1000 transações
+ Recurso complementar aprimorado para incorporação de imagem “Adicione sua imagem”	US$ 0.10 por 1000 transações
+ Recurso complementar aprimorado para prompts de vídeo integrando recuperação de vídeo	US$ 0.05 por minuto para indexação US$ 0.25 por 1000 transações²

No início desta semana, a equipe de pesquisa da Microsoft revelou que o modelo GPT-4 da OpenAI pode vencer o Google Gemini Ultra quando novas técnicas de prompt são usadas. Então, se você está esperando pelo Gemini Ultra, você definitivamente deveria experimentar o GPT-4 Turbo com Vision.

Mais sobre os tópicos: GPT-4 Turbo com Visão, microsoft, openAI

Pradeep Viswav

Especialista em Software e Serviços

Pradeep é graduado em Ciência da Computação e Engenharia. Ele também foi um parceiro estudantil da Microsoft. Atualmente, ele trabalha em uma empresa líder de TI.