Stability AI kohtaa OpenAI Dall-E 3:n uudella Stable Diffusion 3.0 -mallilla

Etusivu » Uutiset

Lukuajan kuvake 2 min. lukea

Kalenterikuvake Julkaistu Helmikuu 22, 2024

by Devesh Beri

Julkaistu Helmikuu 22, 2024

Lukijat auttavat tukemaan MSpoweruseria. Saatamme saada palkkion, jos ostat linkkien kautta.

Keskeiset huomautukset

Stability AI julkaisee Stable Diffusion 3:n, uuden tekstistä kuvaksi -mallin, jolla on parannettu suorituskyky.
Varhainen pääsy on saatavilla jonotuslistan kautta, joka tarjoaa erilaisia mallikokoja laajemman käytettävyyden parantamiseksi.

Stability AI on julkistanut Stable Diffusion 3:n, uusimman tekstistä kuvaksi -sukupolvimallin. Yhtiö väittää, että uusi iteraatio tarjoaa paremman suorituskyvyn monimutkaisten kehotteiden käsittelyssä, laadukkaampien kuvien luomisessa ja kirjoitusvirheiden korjaamisessa.

Tällä hetkellä Stable Diffusion 3 ei ole julkisesti saatavilla. Stability AI:llä on kuitenkin avasi jonotuslistan varhaiseen esikatseluohjelmaan, jonka avulla käyttäjät voivat testata mallia ja antaa palautetta ennen sen virallista julkaisua.

Mitä tulee skaalautumiseen, mallia on erikokoisia, 800 miljoonasta 8 miljardiin parametriin. Tämä lähestymistapa pyrkii vastaamaan käyttäjien tarpeisiin ja laitteiston ominaisuuksiin, mikä mahdollisesti tekee tekniikasta helpomman saatavuuden.

Stability Diffusion 3 yhdistää diffuusiomuuntaja-arkkitehtuurin ja virtauksen sovitustekniikat. Yksityiskohtainen tekninen raportti antaa lisätietoja mallin sisäisestä toiminnasta.

Stable Diffusion 3 -mallisarjan parametrit vaihtelevat tällä hetkellä 800M - 8B. Tällä lähestymistavalla pyritään yhdenmukaistamaan ydinarvojemme kanssa ja demokratisoimaan pääsyä tarjoamalla käyttäjille erilaisia skaalautuvuus- ja laatuvaihtoehtoja, jotka vastaavat parhaiten heidän luovia tarpeitaan.

Stability AI on myös korostanut sitoutumistaan vastuulliseen tekoälykehitykseen. Yritys on ottanut käyttöön suojatoimenpiteet väärinkäytösten estämiseksi ja tekee yhteistyötä asiantuntijoiden kanssa varmistaakseen mallin turvallisen ja eettisen käyttöönoton. Meillä ei ole varaa toiseen Taylor Swiftin saaga.

Lisäksi tekstistä kuvaksi -luonnon viimeaikaisten edistysten yhteydessä tällä alalla jatkuva kilpailu on huomionarvoista. Yritykset, kuten OpenAI, sen DALL-E 3 -mallilla, heräsi Google Gemini, ja Midjourney (joka neuvottelee X:n kanssa), kehittävät ja hiovat myös aktiivisesti tekstistä kuvaksi -ominaisuuksia.

Kaiken kaikkiaan Stable Diffusion 3 toivottavasti esittelee olevansa potentiaalisesti merkittävä edistysaskel tekstistä kuvaksi -tuotantoteknologiassa, mutta sitä ei vielä nähdä.

Lisää: tätä.

Lisää aiheista: Vakaus AI, Vakaa diffuusio

Devesh Beri

Tekninen toimittaja

Nämä asiat motivoivat minua – informatiivisen ja hyödyllisen sisällön luominen, intohimoni harjoittaminen moottoriurheiluun ja musiikkiin, tutkimusretkille osallistuminen, terveiden elämäntapojen ylläpitäminen ja ajan viettäminen suloisen kissani Tacon kanssa.