La IA Gemini de Google tropieza con la generación de imágenes y promete mejorar

Icono de tiempo de lectura 2 minuto. leer


Los lectores ayudan a respaldar a MSpoweruser. Es posible que obtengamos una comisión si compra a través de nuestros enlaces. Icono de información sobre herramientas

Lea nuestra página de divulgación para descubrir cómo puede ayudar a MSPoweruser a sostener el equipo editorial. Leer más

Notas clave

  • Los resultados de imágenes controvertidas resaltan los desafíos a la hora de equilibrar la precisión y la diversidad de modelos de lenguaje grandes.

Google reconoció deficiencias en su herramienta de generación de imágenes Gemini AI después de que la función produjera imágenes de personas inexactas y potencialmente dañinas. La compañía suspendió temporalmente la función mientras trabajaba en una solución. La controversia surgió de la tendencia de Gemini a crear imágenes diversas, incluso cuando los usuarios solicitaban personajes o escenarios históricos específicos. Aunque pretendía ser inclusivo, esto condujo a resultados históricamente inexactos y a veces ofensivos.

En una publicación de blog, el vicepresidente senior Prabhakar Raghavan explicó los errores y prometió mejorar la tecnología. "No queríamos que Gemini se negara a crear imágenes de ningún grupo en particular... [pero] cometerá errores", escribió.

Esto es lo que salió mal con Google Gemini:

  • El ajuste de Google para garantizar que Géminis mostrara una variedad de personas no tuvo en cuenta los casos que deberían claramente no mostrar un rango.
  • Con el tiempo, el modelo se volvió mucho más cauteloso de lo que pretendíamos y se negó a responder ciertas indicaciones por completo, interpretando erróneamente algunas indicaciones muy anodinas como sensibles.
  • Estas dos cosas llevaron al modelo a sobrecompensar en algunos casos y a ser demasiado conservador en otros, dando lugar a imágenes embarazosas y erróneas.

Desafíos de la generación de imágenes por IA:

Este incidente destaca el desafío actual de equilibrar la precisión y la representación en los modelos de generación de imágenes de IA. Los problemas de Google reflejan controversias similares con otros generadores de imágenes populares.

Más sobre los temas: Géminis, google