Por que esperar pelo Gemini Ultra quando você pode usar o GPT-4 Turbo com Vision por meio do serviço Azure OpenAI
2 minutos. ler
Publicado em
Leia nossa página de divulgação para descobrir como você pode ajudar o MSPoweruser a sustentar a equipe editorial Saiba mais
OpenAI's GPT-4 Turbo com Visão é um grande modelo multimodal (LMM) que pode analisar imagens e fornecer respostas textuais a perguntas sobre elas. Este modelo avançado de IA multimodal inclui todos os recursos do GPT-4 Turbo, ao mesmo tempo que adiciona a capacidade de processar e analisar entradas de imagem.
Hoje, Microsoft anunciou esse GPT-4 Turbo com Vision agora está disponível por meio do Azure OpenAI Service. Os clientes existentes do Azure OpenAI Service nas regiões Azure Leste da Austrália, Central da Suécia, Norte da Suíça e Oeste dos EUA agora podem acessar o serviço GPT-4 Turbo com Vision.
Juntamente com a disponibilidade do GPT-4 Turbo com Vision, a Microsoft está anunciando melhorias nos serviços de IA do Azure, permitindo funcionalidades avançadas.
- Reconhecimento óptico de caracteres (OCR): Extrai texto de imagens, integrando-o ao prompt e imagem do usuário para enriquecer o contexto.
- Aterramento de objeto: aprimora as respostas de texto do GPT-4 Turbo com Vision, identificando e delineando objetos-chave nas imagens.
- Solicitações de vídeo: permite que o GPT-4 Turbo com Vision responda perguntas usando os quadros mais relevantes de um vídeo com base na solicitação do usuário.
- Serviço Azure OpenAI nos seus dados com imagens: Ao combinar GPT-4 Turbo com Vision, Azure AI Search e Azure AI Vision, as imagens agora podem ser adicionadas com dados de texto, utilizando pesquisa vetorial para desenvolver uma solução que se conecta aos dados do usuário, permitindo uma experiência de chat aprimorada.
O serviço GPT-4 Turbo com Vision on Azure OpenAI será cobrado com base no número de tokens de entrada e saída. Encontre os detalhes abaixo.
Modelo | Entrada | saída |
GPT-4 Turbo com Visão1 | US$ 0.01 por 1000 tokens | US$ 0.03 por 1000 tokens |
+ Recursos complementares aprimorados para OCR | US$ 1.50 por 1000 transações | |
+ Recursos complementares aprimorados para Object Grounding | US$ 1.50 por 1000 transações | |
+ Recurso complementar aprimorado para incorporação de imagem “Adicione sua imagem” | US$ 0.10 por 1000 transações | |
+ Recurso complementar aprimorado para prompts de vídeo integrando recuperação de vídeo | US$ 0.05 por minuto para indexação US$ 0.25 por 1000 transações2 |
No início desta semana, a equipe de pesquisa da Microsoft revelou que o modelo GPT-4 da OpenAI pode vencer o Google Gemini Ultra quando novas técnicas de prompt são usadas. Então, se você está esperando pelo Gemini Ultra, você definitivamente deveria experimentar o GPT-4 Turbo com Vision.