Stability AI se enfrenta a OpenAI Dall-E 3 con el nuevo modelo Stable Diffusion 3.0

Icono de tiempo de lectura 2 minuto. leer

Icono de calendario Publicado el Febrero 22, 2024

Publicado en Febrero 22, 2024

Los lectores ayudan a respaldar a MSpoweruser. Es posible que obtengamos una comisión si compra a través de nuestros enlaces.

Notas clave

Stability AI lanza Stable Diffusion 3, un nuevo modelo de conversión de texto a imagen con rendimiento mejorado.
El acceso temprano está disponible a través de una lista de espera, que ofrece diversos tamaños de modelos para una mayor accesibilidad.

Stability AI ha presentado Stable Diffusion 3, su último modelo de generación de texto a imagen. La compañía afirma que la nueva versión ofrece un rendimiento mejorado en el manejo de indicaciones complejas, generando imágenes de mayor calidad y corrigiendo errores ortográficos.

Actualmente, Stable Diffusion 3 no está disponible públicamente. Sin embargo, la IA de estabilidad tiene abrió una lista de espera para un programa de vista previa temprana, que permita a los usuarios probar el modelo y proporcionar comentarios antes de su lanzamiento oficial.

En cuanto a escalabilidad, el modelo viene en varios tamaños, desde 800 millones hasta 8 mil millones de parámetros. Este enfoque tiene como objetivo satisfacer las necesidades de los usuarios y las capacidades del hardware, haciendo potencialmente que la tecnología sea más accesible.

Stability Diffusion 3 combina la arquitectura del transformador de difusión y técnicas de adaptación de flujo. Un informe técnico detallado proporcionará más información sobre el funcionamiento interno del modelo.

El conjunto de modelos Stable Diffusion 3 actualmente abarca parámetros de 800M a 8B. Este enfoque tiene como objetivo alinearse con nuestros valores fundamentales y democratizar el acceso, brindando a los usuarios varias opciones de escalabilidad y calidad para satisfacer mejor sus necesidades creativas.

Stability AI también ha enfatizado su compromiso con el desarrollo responsable de la IA. La compañía ha implementado salvaguardas para evitar el uso indebido y colabora con expertos para garantizar la implementación segura y ética del modelo. No podemos permitirnos otro Saga de Taylor Swift.

Además, en el contexto de los avances recientes en la generación de texto a imagen, vale la pena señalar la competencia actual en este campo. Empresas como OpenAI, con su modelo DALL-E 3, despertó a Google Géminis, y A mitad del viaje (que está en conversaciones con X), también están desarrollando y perfeccionando activamente sus capacidades de conversión de texto a imagen.

En general, se espera que Stable Diffusion 3 se presente como un avance potencialmente significativo en la tecnología de generación de texto a imagen, pero aún está por verse.

Más aquí.

Devesh Beri

Periodista de tecnología

Estas son las cosas que me motivan: crear contenido informativo y útil, perseguir mi pasión por los deportes de motor y la música, participar en expediciones, mantener un estilo de vida saludable y pasar tiempo con mi adorable gato Taco.

Foro de usuarios

mensajes de 0

Ordenar:

Deje un comentario