A Stability AI felveszi az OpenAI Dall-E 3-at az új Stable Diffusion 3.0 modellel
2 perc olvas
Publikálva
Olvassa el közzétételi oldalunkat, hogy megtudja, hogyan segítheti az MSPowerusert a szerkesztői csapat fenntartásában Tovább
Főbb megjegyzések
- A Stability AI piacra dobja a Stable Diffusion 3-at, egy új, jobb teljesítményű szöveg-kép modellt.
- A korai hozzáférés egy várólistán keresztül érhető el, amely változatos modellméreteket kínál a szélesebb körű hozzáférhetőség érdekében.
A Stability AI bemutatta a Stable Diffusion 3-at, a legújabb szöveg-képgenerációs modelljét. A vállalat állítása szerint az új iteráció jobb teljesítményt kínál az összetett felszólítások kezelésében, jobb minőségű képek generálásában és a helyesírási hibák javításában.
Jelenleg a Stable Diffusion 3 nem elérhető nyilvánosan. A Stability AI azonban rendelkezik várólistát nyitott egy korai előnézeti programhoz, amely lehetővé teszi a felhasználók számára a modell tesztelését és visszajelzést a hivatalos megjelenés előtt.
Ami a méretezhetőséget illeti, a modell különböző méretekben kapható, 800 milliótól 8 milliárd paraméterig terjed. Ez a megközelítés a felhasználói igényeket és a hardverképességeket kívánja kielégíteni, potenciálisan elérhetőbbé téve a technológiát.
A Stability Diffusion 3 egyesíti a diffúziós transzformátor architektúrát és az áramlásillesztési technikákat. A részletes műszaki jelentés további információkat nyújt a modell belső működéséről.
A Stable Diffusion 3 modellcsomag jelenleg 800M-től 8B-ig terjed. Ennek a megközelítésnek az a célja, hogy összhangba kerüljön alapvető értékeinkkel és demokratizálja a hozzáférést, és a felhasználók számára különféle lehetőségeket biztosítson a méretezhetőség és a minőség tekintetében, hogy a legjobban megfeleljen kreatív igényeiknek.
Stabilitás A mesterséges intelligencia a felelős AI-fejlesztés iránti elkötelezettségét is hangsúlyozta. A vállalat biztosítékokat vezetett be a visszaélések megelőzése érdekében, és együttműködik szakértőkkel a modell biztonságos és etikus telepítésének biztosítása érdekében. Mást nem engedhetünk meg magunknak Taylor Swift saga.
Ezen túlmenően, a szöveg-kép létrehozása terén elért közelmúltbeli fejlemények összefüggésében érdemes megjegyezni az ezen a területen folyó versenyt. Az olyan cégek, mint az OpenAI, a DALL-E 3 modellel, felébresztette a Google Geminit, és Midjourney (amely X-szel tárgyal), szintén aktívan fejlesztik és finomítják szöveggé képpé képességeiket.
Összességében a Stable Diffusion 3 remélhetőleg jelentős előrelépésként jelenik meg a szöveg-képgenerálási technológia terén, de ez még várat magára.
Több itt.