Microsoftin uusi tekoälytyökalu tekee mielikuvituksestasi totta

Lukuajan kuvake 3 min. lukea


Lukijat auttavat tukemaan MSpoweruseria. Saatamme saada palkkion, jos ostat linkkien kautta. Työkaluvihje-kuvake

Lue ilmoitussivumme saadaksesi selville, kuinka voit auttaa MSPoweruseria ylläpitämään toimitustiimiä Lue lisää

Kuvittele, että pystyt luomaan korkealaatuisia valokuvia vain kuvailemalla niitä tietokoneella. Tämä sci-fi-skenaario on nyt totta Microsoftin uuden tekoälytyökalun ansiosta.

Drawing Bot loi yllä olevan kuvan yksinkertaisesti ""lintu, jolla on keltainen vartalo, mustat siivet ja lyhyt nokka,” käyttää uutta tekniikkaa, jossa tekoäly kiinnittää erityistä huomiota yksittäisiin sanoihin luodessaan kuvia kuvatekstimäisistä tekstikuvauksista, mikä johtaa kolminkertaiseen kuvanlaatuun verrattuna muihin tekstistä kuvaksi luontitekniikoihin.

Botti voi tehdä muutakin kuin lintuja, sillä se pystyy piirtämään kaikkea tavallisista pastoraalisista kohtauksista, kuten karjan laiduntamisesta, absurdeihin, kuten kelluvaan kaksikerroksiseen bussiin.

"Jos menet Bingiin ja etsit lintua, saat lintukuvan. Mutta täällä kuvat luodaan tietokoneella, pikseli pikseliltä, ​​tyhjästä", sanoi Xiaodong He, päätutkija ja tutkimuspäällikkö Deep Learning Technology Centerissä Microsoftin tutkimuslaboratoriossa Redmondissa, Washingtonissa. "Näitä lintuja ei ehkä ole olemassa todellisessa maailmassa - ne ovat vain osa tietokoneemme lintukuvitusta."

Tiimi aloitti CaptionBotilla, joka kirjoitti automaattisesti kuvatekstejä kuville (käytetään esimerkiksi Facebookissa kuvien merkitsemiseen esteettömyystarkoituksiin), sitten SeeingAI:lla, joka antoi näkövammaisille käyttäjille mahdollisuuden kuvata kohtauksia puhelimen kameralla, ja nyt vihdoin. Piirustus Botti.

"Nyt haluamme käyttää tekstiä kuvan luomiseen", sanoi Qiuyuan Huang, He-ryhmän tutkijatohtori ja paperin kirjoittaja. "Se on siis kiertokulku."

Feat on esimerkki Generatiivinen Adversarial Network tai GAN, jossa yksi AI-verkko, generaattori yrittää saada väärennettyjä kuvia toisen AI-verkon, erottelijan, ohi. Yhdessä työskentelemällä erottelija työntää generaattoria kohti täydellisyyttä.

Uusi tekniikka parantaa tekniikan tasoa keskittymällä vuorotellen lauseen eri osiin, esim. piirtämällä ensin keltainen lintu, sitten mustat siivet ja sitten lyhyt nokka.

”Huomio on ihmisen käsite; käytämme matematiikkaa tehdäksemme huomiosta laskennallista", hän selitti.

"Voimme hallita kuvauksiamme ja nähdä, kuinka kone reagoi", hän selitti. ”Voimme tunkeilla ja testata, mitä kone oppi. Koneella on jonkin verran opittua maalaisjärkeä, mutta se voi silti seurata sitä, mitä kysyt, ja ehkä joskus se näyttää hieman naurettavalta."

Tekstistä kuvaksi -generointiteknologialle voisi löytyä käytännöllisiä sovelluksia, jotka voisivat toimia eräänlaisena luonnosapulaisena maalareille ja sisustussuunnittelijoille tai työkaluna ääniaktivoitujen kuvien tarkentamiseen. Lisäämällä laskentatehoa hän kuvittelee, että tekniikka voisi tuottaa käsikirjoituksiin perustuvia animaatioelokuvia, mikä lisää animaatioelokuvantekijöiden työtä poistamalla osan siihen liittyvästä manuaalisesta työstä.

"Jotta tekoäly ja ihmiset voivat elää samassa maailmassa, heillä on oltava tapa olla vuorovaikutuksessa toistensa kanssa", hän selitti. "Ja kieli ja visio ovat kaksi tärkeintä tapaa, joilla ihmiset ja koneet voivat olla vuorovaikutuksessa keskenään."

Koko tutkimusta kuvaava paperi löytyy osoitteesta arXiv.org.

kautta Microsoft.com

Lisää aiheista: ai, piirustusbotti, microsoft, tutkimus

Jätä vastaus

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *