Stability AI vydává Stable Diffusion 3 Medium, vylepšené ruce a obličeje v generovaném obsahu

Ikona času čtení 2 min. číst


Čtenáři pomáhají podporovat MSpoweruser. Pokud nakoupíte prostřednictvím našich odkazů, můžeme získat provizi. Ikona popisku

Přečtěte si naši informační stránku a zjistěte, jak můžete pomoci MSPoweruser udržet redakční tým Více informací

Klíčové poznámky

  • Stability AI uvádí na trh Stable Diffusion 3 Medium, model umělé inteligence s otevřeným zdrojovým kódem pro převod textu na obrázek.
  • SD3 Medium generuje vysoce kvalitní obrázky, dobře zpracovává textové prvky a běží na standardních spotřebitelských GPU.
Stabilita.ai

Stability AI vydala Stable Diffusion 3 Medium (SD3 Medium). Společnost řadí SD3 Medium jako svůj dosud nejpokročilejší open-source model lepší než Midjourney 6.

Podle Stability AI je SD3 Medium schopné generovat fotorealistické obrázky z textových popisů. Model je navržen tak, aby řešil výzvy, kterým dříve čelily téměř všechny generátory obrázků AI s rukama a tvářemi v generovaném obsahu.

SD3 Medium také obsahuje textové prvky s vysokou přesností díky základní architektuře Diffusion Transformer.

Hlavním aspektem SD3 Medium je jeho dostupnost. Na rozdíl od některých modelů s umělou inteligencí náročných na zdroje je SD3 Medium vyrobeno tak, aby fungovalo na standardních spotřebitelských grafických kartách. To mu může pomoci v širším uživatelském přijetí. Model také nabízí možnosti přizpůsobení pomocí malých datových sad, jak odhalil Stabilita AI.

Stability AI také naznačila plány na rozšíření své nabídky v budoucnu o generování videa a zvuku, jak uvádí Další web.

Stability AI nabízí SD3 Medium pod nekomerční licencí k bezplatnému použití. Pro komerční aplikace je pro umělce, designéry a vývojáře k dispozici Creator License.

Pokud jste komerčním uživatelem ve velkém měřítku, můžete se obrátit přímo na Stability AI a získat podrobnosti o licencích. To přichází poté, co vývojáři obdrželi Přístup k API pro Stable Diffusion 3 pár měsíců zpět.

Stručně řečeno, Stable Diffusion 3 Medium představuje krok vpřed v přístupném a výkonném generování umělé inteligence pro převod textu na obrázek, zejména pokud jde o generování rukou a tváří.

Uživatelské fórum

0 zprávy