Stabilitet AI tar fatt på OpenAI Dall-E 3 med den nye Stable Diffusion 3.0-modellen

Ikon for lesetid 2 min. lese


Lesere hjelper til med å støtte MSpoweruser. Vi kan få provisjon hvis du kjøper gjennom lenkene våre. Verktøytipsikon

Les vår avsløringsside for å finne ut hvordan du kan hjelpe MSPoweruser opprettholde redaksjonen Les mer

Viktige merknader

  • Stability AI lanserer Stable Diffusion 3, en ny tekst-til-bilde-modell med forbedret ytelse.
  • Tidlig tilgang er tilgjengelig via en venteliste, og tilbyr ulike modellstørrelser for bredere tilgjengelighet.

Stability AI har avduket Stable Diffusion 3, den nyeste tekst-til-bilde-generasjonsmodellen. Selskapet hevder at den nye iterasjonen gir forbedret ytelse ved håndtering av komplekse spørsmål, generering av bilder av høyere kvalitet og retting av stavefeil.

Foreløpig er ikke Stable Diffusion 3 offentlig tilgjengelig. Stabilitet AI har imidlertid åpnet en venteliste for et tidlig forhåndsvisningsprogram, som lar brukere teste modellen og gi tilbakemelding før den offisielle lanseringen.

Når det gjelder skalerbarhet, kommer modellen i forskjellige størrelser, fra 800 millioner til 8 milliarder parametere. Denne tilnærmingen tar sikte på å imøtekomme brukerbehov og maskinvarefunksjoner, og potensielt gjøre teknologien mer tilgjengelig.

Stability Diffusion 3 kombinerer diffusjonstransformatorarkitektur og strømningstilpasningsteknikker. En detaljert teknisk rapport vil gi ytterligere informasjon om modellens indre funksjoner.

Stable Diffusion 3-serien med modeller varierer for tiden fra 800M til 8B parametere. Denne tilnærmingen tar sikte på å samsvare med våre kjerneverdier og demokratisere tilgangen, og gi brukerne ulike muligheter for skalerbarhet og kvalitet for best mulig å møte deres kreative behov.

Stabilitet AI har også understreket sin forpliktelse til ansvarlig AI-utvikling. Selskapet har implementert sikkerhetstiltak for å forhindre misbruk og samarbeider med eksperter for å sikre modellens trygge og etiske utplassering. Vi har ikke råd til en annen Taylor Swift-sagaen.

I tillegg, i sammenheng med nyere fremskritt innen tekst-til-bilde-generering, er den pågående konkurransen på dette feltet verdt å merke seg. Selskaper som OpenAI, med sin DALL-E 3-modell, vekket Google Gemini, og Midjourney (som er i samtaler med X), utvikler og foredler også tekst-til-bilde-funksjonene sine.

Totalt sett presenterer Stable Diffusion 3 seg forhåpentligvis som et potensielt betydelig fremskritt innen tekst-til-bilde-genereringsteknologi, men det er ennå ikke sett.

Mer her..

Mer om temaene: Stabilitet AI, Stabil diffusjon