Stability AI kohtaa OpenAI Dall-E 3:n uudella Stable Diffusion 3.0 -mallilla

Lukuajan kuvake 2 min. lukea


Lukijat auttavat tukemaan MSpoweruseria. Saatamme saada palkkion, jos ostat linkkien kautta. Työkaluvihje-kuvake

Lue ilmoitussivumme saadaksesi selville, kuinka voit auttaa MSPoweruseria ylläpitämään toimitustiimiä Lue lisää

Keskeiset huomautukset

  • Stability AI julkaisee Stable Diffusion 3:n, uuden tekstistä kuvaksi -mallin, jolla on parannettu suorituskyky.
  • Varhainen pääsy on saatavilla jonotuslistan kautta, joka tarjoaa erilaisia ​​mallikokoja laajemman käytettävyyden parantamiseksi.
Stabiliteetti.ai

Stability AI on julkistanut Stable Diffusion 3:n, uusimman tekstistä kuvaksi -sukupolvimallin. Yhtiö väittää, että uusi iteraatio tarjoaa paremman suorituskyvyn monimutkaisten kehotteiden käsittelyssä, laadukkaampien kuvien luomisessa ja kirjoitusvirheiden korjaamisessa.

Tällä hetkellä Stable Diffusion 3 ei ole julkisesti saatavilla. Stability AI:llä on kuitenkin avasi jonotuslistan varhaiseen esikatseluohjelmaan, jonka avulla käyttäjät voivat testata mallia ja antaa palautetta ennen sen virallista julkaisua.

Mitä tulee skaalautumiseen, mallia on erikokoisia, 800 miljoonasta 8 miljardiin parametriin. Tämä lähestymistapa pyrkii vastaamaan käyttäjien tarpeisiin ja laitteiston ominaisuuksiin, mikä mahdollisesti tekee tekniikasta helpomman saatavuuden.

Stability Diffusion 3 yhdistää diffuusiomuuntaja-arkkitehtuurin ja virtauksen sovitustekniikat. Yksityiskohtainen tekninen raportti antaa lisätietoja mallin sisäisestä toiminnasta.

Stable Diffusion 3 -mallisarjan parametrit vaihtelevat tällä hetkellä 800M - 8B. Tällä lähestymistavalla pyritään yhdenmukaistamaan ydinarvojemme kanssa ja demokratisoimaan pääsyä tarjoamalla käyttäjille erilaisia ​​skaalautuvuus- ja laatuvaihtoehtoja, jotka vastaavat parhaiten heidän luovia tarpeitaan.

Stability AI on myös korostanut sitoutumistaan ​​vastuulliseen tekoälykehitykseen. Yritys on ottanut käyttöön suojatoimenpiteet väärinkäytösten estämiseksi ja tekee yhteistyötä asiantuntijoiden kanssa varmistaakseen mallin turvallisen ja eettisen käyttöönoton. Meillä ei ole varaa toiseen Taylor Swiftin saaga.

Lisäksi tekstistä kuvaksi -luonnon viimeaikaisten edistysten yhteydessä tällä alalla jatkuva kilpailu on huomionarvoista. Yritykset, kuten OpenAI, sen DALL-E 3 -mallilla, heräsi Google Gemini, ja Midjourney (joka neuvottelee X:n kanssa), kehittävät ja hiovat myös aktiivisesti tekstistä kuvaksi -ominaisuuksia.

Kaiken kaikkiaan Stable Diffusion 3 toivottavasti esittelee olevansa potentiaalisesti merkittävä edistysaskel tekstistä kuvaksi -tuotantoteknologiassa, mutta sitä ei vielä nähdä.

Lisää: tätä.

Lisää aiheista: Vakaus AI, Vakaa diffuusio