A Stability AI felveszi az OpenAI Dall-E 3-at az új Stable Diffusion 3.0 modellel

Kezdőlap » Hírek

Olvasási idő ikonra 2 perc olvas

Naptár ikonra Publikálva Február 22, 2024

by Devesh Beri

közzétették Február 22, 2024

Az olvasók segítenek az MSpoweruser támogatásában. Kaphatunk jutalékot, ha a linkjeinken keresztül vásárol.

Főbb megjegyzések

A Stability AI piacra dobja a Stable Diffusion 3-at, egy új, jobb teljesítményű szöveg-kép modellt.
A korai hozzáférés egy várólistán keresztül érhető el, amely változatos modellméreteket kínál a szélesebb körű hozzáférhetőség érdekében.

A Stability AI bemutatta a Stable Diffusion 3-at, a legújabb szöveg-képgenerációs modelljét. A vállalat állítása szerint az új iteráció jobb teljesítményt kínál az összetett felszólítások kezelésében, jobb minőségű képek generálásában és a helyesírási hibák javításában.

Jelenleg a Stable Diffusion 3 nem elérhető nyilvánosan. A Stability AI azonban rendelkezik várólistát nyitott egy korai előnézeti programhoz, amely lehetővé teszi a felhasználók számára a modell tesztelését és visszajelzést a hivatalos megjelenés előtt.

Ami a méretezhetőséget illeti, a modell különböző méretekben kapható, 800 milliótól 8 milliárd paraméterig terjed. Ez a megközelítés a felhasználói igényeket és a hardverképességeket kívánja kielégíteni, potenciálisan elérhetőbbé téve a technológiát.

A Stability Diffusion 3 egyesíti a diffúziós transzformátor architektúrát és az áramlásillesztési technikákat. A részletes műszaki jelentés további információkat nyújt a modell belső működéséről.

A Stable Diffusion 3 modellcsomag jelenleg 800M-től 8B-ig terjed. Ennek a megközelítésnek az a célja, hogy összhangba kerüljön alapvető értékeinkkel és demokratizálja a hozzáférést, és a felhasználók számára különféle lehetőségeket biztosítson a méretezhetőség és a minőség tekintetében, hogy a legjobban megfeleljen kreatív igényeiknek.

Stabilitás A mesterséges intelligencia a felelős AI-fejlesztés iránti elkötelezettségét is hangsúlyozta. A vállalat biztosítékokat vezetett be a visszaélések megelőzése érdekében, és együttműködik szakértőkkel a modell biztonságos és etikus telepítésének biztosítása érdekében. Mást nem engedhetünk meg magunknak Taylor Swift saga.

Ezen túlmenően, a szöveg-kép létrehozása terén elért közelmúltbeli fejlemények összefüggésében érdemes megjegyezni az ezen a területen folyó versenyt. Az olyan cégek, mint az OpenAI, a DALL-E 3 modellel, felébresztette a Google Geminit, és Midjourney (amely X-szel tárgyal), szintén aktívan fejlesztik és finomítják szöveggé képpé képességeiket.

Összességében a Stable Diffusion 3 remélhetőleg jelentős előrelépésként jelenik meg a szöveg-képgenerálási technológia terén, de ez még várat magára.

Több itt.

Bővebben a témákról: Stabilitás AI, Stabil diffúzió

Devesh Beri

Műszaki újságíró

Ezek azok a dolgok, amelyek motiválnak – informatív és hasznos tartalmak létrehozása, motorsport és zene iránti szenvedélyem gyakorlása, expedíciók részvétele, egészséges életmód fenntartása, és az imádnivaló Tacó macskámmal való időtöltés.