Stability AI se enfrenta a OpenAI Dall-E 3 con el nuevo modelo Stable Diffusion 3.0

Icono de tiempo de lectura 2 minuto. leer


Los lectores ayudan a respaldar a MSpoweruser. Es posible que obtengamos una comisión si compra a través de nuestros enlaces. Icono de información sobre herramientas

Lea nuestra página de divulgación para descubrir cómo puede ayudar a MSPoweruser a sostener el equipo editorial. Leer más

Notas clave

  • Stability AI lanza Stable Diffusion 3, un nuevo modelo de conversión de texto a imagen con rendimiento mejorado.
  • El acceso temprano está disponible a través de una lista de espera, que ofrece diversos tamaños de modelos para una mayor accesibilidad.
Estabilidad.ai

Stability AI ha presentado Stable Diffusion 3, su último modelo de generación de texto a imagen. La compañía afirma que la nueva versión ofrece un rendimiento mejorado en el manejo de indicaciones complejas, generando imágenes de mayor calidad y corrigiendo errores ortográficos.

Actualmente, Stable Diffusion 3 no está disponible públicamente. Sin embargo, la IA de estabilidad tiene abrió una lista de espera para un programa de vista previa temprana, que permita a los usuarios probar el modelo y proporcionar comentarios antes de su lanzamiento oficial.

En cuanto a escalabilidad, el modelo viene en varios tamaños, desde 800 millones hasta 8 mil millones de parámetros. Este enfoque tiene como objetivo satisfacer las necesidades de los usuarios y las capacidades del hardware, haciendo potencialmente que la tecnología sea más accesible.

Stability Diffusion 3 combina la arquitectura del transformador de difusión y técnicas de adaptación de flujo. Un informe técnico detallado proporcionará más información sobre el funcionamiento interno del modelo.

El conjunto de modelos Stable Diffusion 3 actualmente abarca parámetros de 800M a 8B. Este enfoque tiene como objetivo alinearse con nuestros valores fundamentales y democratizar el acceso, brindando a los usuarios varias opciones de escalabilidad y calidad para satisfacer mejor sus necesidades creativas.

Stability AI también ha enfatizado su compromiso con el desarrollo responsable de la IA. La compañía ha implementado salvaguardas para evitar el uso indebido y colabora con expertos para garantizar la implementación segura y ética del modelo. No podemos permitirnos otro Saga de Taylor Swift.

Además, en el contexto de los avances recientes en la generación de texto a imagen, vale la pena señalar la competencia actual en este campo. Empresas como OpenAI, con su modelo DALL-E 3, despertó a Google Géminis, y A mitad del viaje (que está en conversaciones con X), también están desarrollando y perfeccionando activamente sus capacidades de conversión de texto a imagen.

En general, se espera que Stable Diffusion 3 se presente como un avance potencialmente significativo en la tecnología de generación de texto a imagen, pero aún está por verse.

Más aquí.

Foro de usuarios

mensajes de 0