¿Por qué esperar a Gemini Ultra cuando puedes usar GPT-4 Turbo con Vision a través del servicio Azure OpenAI?

Icono de tiempo de lectura 2 minuto. leer


Los lectores ayudan a respaldar a MSpoweruser. Es posible que obtengamos una comisión si compra a través de nuestros enlaces. Icono de información sobre herramientas

Lea nuestra página de divulgación para descubrir cómo puede ayudar a MSPoweruser a sostener el equipo editorial. Leer más

OpenAI GPT-4 Turbo frente a Gemini Ultra

OpenAI's GPT-4 Turbo con visión es un gran modelo multimodal (LMM) que puede analizar imágenes y proporcionar respuestas textuales a preguntas sobre ellas. Este modelo avanzado de IA multimodal incluye todas las capacidades de GPT-4 Turbo y agrega la capacidad de procesar y analizar entradas de imágenes. 

Hoy, Microsoft anunció ese GPT-4 Turbo con Vision ahora está disponible a través del servicio Azure OpenAI. Los clientes existentes del servicio Azure OpenAI en las regiones de Azure Este de Australia, Centro de Suecia, Norte de Suiza y Oeste de EE. UU. ahora pueden acceder al servicio GPT-4 Turbo con Vision.

Junto con la disponibilidad de GPT-4 Turbo con Vision, Microsoft anuncia siguientes mejoras en los servicios de Azure AI que permiten funcionalidades avanzadas.

  • Reconocimiento óptico de caracteres (OCR): Extrae texto de imágenes, integrándolo con el mensaje del usuario y la imagen para enriquecer el contexto. 
  • Puesta a tierra de objetos: Mejora las respuestas de texto de GPT-4 Turbo con Vision al identificar y delinear objetos clave dentro de las imágenes. 
  • Indicaciones en vídeo: Permite que GPT-4 Turbo con Vision responda preguntas utilizando los cuadros más relevantes de un video según las indicaciones del usuario. 
  • Servicio Azure OpenAI en sus datos con imágenes: Al combinar GPT-4 Turbo con Vision, Azure AI Search y Azure AI Vision, ahora se pueden agregar imágenes con datos de texto, utilizando la búsqueda vectorial para desarrollar una solución que se conecta con los datos del usuario, lo que permite una experiencia de chat mejorada.

El servicio GPT-4 Turbo con Vision en Azure OpenAI se cobrará según la cantidad de tokens de entrada y salida. Encuentre los detalles a continuación.

ModeloEntrada Salida 
GPT-4 Turbo con visión1$0.01 por 1000 fichas$0.03 por 1000 fichas
+ Funciones complementarias mejoradas para OCR$1.50 por 1000 transacciones
+ Funciones complementarias mejoradas para conexión a tierra de objetos$1.50 por 1000 transacciones
+ Función complementaria mejorada para incrustar imágenes "Agrega tu imagen"$0.10 por 1000 transacciones
+ Función complementaria mejorada para mensajes de vídeo que integran la recuperación de vídeo$0.05 por minuto para indexación$0.25 por 1000 transacciones2

A principios de esta semana, el equipo de investigación de Microsoft revelado que el modelo GPT-4 de OpenAI puede vencer a Google Gemini Ultra cuando se utilizan nuevas técnicas de indicación. Entonces, si estás esperando Gemini Ultra, definitivamente deberías probar GPT-4 Turbo con Vision.

Más sobre los temas: GPT-4 Turbo con visión, microsoft, IA abierta