Stability AI affronte OpenAI Dall-E 3 avec le nouveau modèle Stable Diffusion 3.0
2 minute. lis
Publié le
Lisez notre page de divulgation pour savoir comment vous pouvez aider MSPoweruser à soutenir l'équipe éditoriale Plus d'informations
Notes clés
- Stability AI lance Stable Diffusion 3, un nouveau modèle de conversion texte-image aux performances améliorées.
- L'accès anticipé est disponible via une liste d'attente, offrant diverses tailles de modèles pour une accessibilité plus large.
Stability AI a dévoilé Stable Diffusion 3, son dernier modèle de génération de texte en image. La société affirme que la nouvelle itération offre des performances améliorées dans la gestion des invites complexes, la génération d'images de meilleure qualité et la correction des fautes d'orthographe.
Actuellement, Stable Diffusion 3 n’est pas accessible au public. Cependant, Stability AI a a ouvert une liste d'attente pour un programme en avant-première, permettant aux utilisateurs de tester le modèle et de fournir des commentaires avant sa sortie officielle.
Concernant l'évolutivité, le modèle se décline en différentes tailles, allant de 800 millions à 8 milliards de paramètres. Cette approche vise à répondre aux besoins des utilisateurs et aux capacités matérielles, rendant potentiellement la technologie plus accessible.
Stability Diffusion 3 combine une architecture de transformateur de diffusion et des techniques d'adaptation de flux. Un rapport technique détaillé fournira de plus amples informations sur le fonctionnement interne du modèle.
La suite de modèles Stable Diffusion 3 va actuellement de paramètres 800M à 8B. Cette approche vise à s'aligner sur nos valeurs fondamentales et à démocratiser l'accès, en offrant aux utilisateurs diverses options d'évolutivité et de qualité pour répondre au mieux à leurs besoins créatifs.
Stability AI a également souligné son engagement en faveur du développement responsable de l’IA. L'entreprise a mis en place des mesures de protection pour éviter toute utilisation abusive et collabore avec des experts pour garantir le déploiement sûr et éthique du modèle. Nous ne pouvons pas nous permettre un autre La saga Taylor Swift.
De plus, dans le contexte des progrès récents dans la génération de texte en image, il convient de noter la concurrence continue dans ce domaine. Des entreprises comme OpenAI, avec son modèle DALL-E 3, j'ai réveillé Google Gemini, et Mi-parcours (qui est en pourparlers avec X), développent et affinent également activement leurs capacités de conversion texte-image.
Dans l’ensemble, Stable Diffusion 3 se présente, espérons-le, comme une avancée potentiellement significative dans la technologie de génération de texte en image, mais cela reste à voir.
Plus ici.
Forum des utilisateurs
Messages 0