Stability AI affronte OpenAI Dall-E 3 avec le nouveau modèle Stable Diffusion 3.0

2 minute. lis

Publié le 22 février 2024

publié sur 22 février 2024

Les lecteurs aident à prendre en charge MSpoweruser. Nous pouvons recevoir une commission si vous achetez via nos liens.

Notes clés

Stability AI lance Stable Diffusion 3, un nouveau modèle de conversion texte-image aux performances améliorées.
L'accès anticipé est disponible via une liste d'attente, offrant diverses tailles de modèles pour une accessibilité plus large.

Stability AI a dévoilé Stable Diffusion 3, son dernier modèle de génération de texte en image. La société affirme que la nouvelle itération offre des performances améliorées dans la gestion des invites complexes, la génération d'images de meilleure qualité et la correction des fautes d'orthographe.

Actuellement, Stable Diffusion 3 n’est pas accessible au public. Cependant, Stability AI a a ouvert une liste d'attente pour un programme en avant-première, permettant aux utilisateurs de tester le modèle et de fournir des commentaires avant sa sortie officielle.

Concernant l'évolutivité, le modèle se décline en différentes tailles, allant de 800 millions à 8 milliards de paramètres. Cette approche vise à répondre aux besoins des utilisateurs et aux capacités matérielles, rendant potentiellement la technologie plus accessible.

Stability Diffusion 3 combine une architecture de transformateur de diffusion et des techniques d'adaptation de flux. Un rapport technique détaillé fournira de plus amples informations sur le fonctionnement interne du modèle.

La suite de modèles Stable Diffusion 3 va actuellement de paramètres 800M à 8B. Cette approche vise à s'aligner sur nos valeurs fondamentales et à démocratiser l'accès, en offrant aux utilisateurs diverses options d'évolutivité et de qualité pour répondre au mieux à leurs besoins créatifs.

Stability AI a également souligné son engagement en faveur du développement responsable de l’IA. L'entreprise a mis en place des mesures de protection pour éviter toute utilisation abusive et collabore avec des experts pour garantir le déploiement sûr et éthique du modèle. Nous ne pouvons pas nous permettre un autre La saga Taylor Swift.

De plus, dans le contexte des progrès récents dans la génération de texte en image, il convient de noter la concurrence continue dans ce domaine. Des entreprises comme OpenAI, avec son modèle DALL-E 3, j'ai réveillé Google Gemini, et Mi-parcours (qui est en pourparlers avec X), développent et affinent également activement leurs capacités de conversion texte-image.

Dans l’ensemble, Stable Diffusion 3 se présente, espérons-le, comme une avancée potentiellement significative dans la technologie de génération de texte en image, mais cela reste à voir.

Plus ici.

Devesh Beri

Journaliste technique

Ce sont les choses qui me motivent : créer du contenu informatif et utile, poursuivre ma passion pour les sports mécaniques et la musique, participer à des expéditions, maintenir un mode de vie sain et passer du temps avec mon adorable chat Taco.

Laissez un commentaire