Microsoft Research arbejder med en AI, der kan fortælle historien om dine feriebilleder

Ikon for læsetid 2 min. Læs


Læsere hjælper med at understøtte MSpoweruser. Vi får muligvis en kommission, hvis du køber via vores links. Værktøjstip-ikon

Læs vores oplysningsside for at finde ud af, hvordan du kan hjælpe MSPoweruser med at opretholde redaktionen Læs mere

tur til stranden

AI, der kan beskrive billeder, er allerede på arbejde på internettet, f.eks. tilføjer billedtekster til billeder på Facebook. Nu tager Microsoft Research teknologien til næste niveau og beder deres AI om at fortælle historien om en serie billeder.

For eksempel, mens et billedtekstprogram kan tage fem billeder og sige: "Dette er et billede af en familie; dette er et billede af en kage; dette er et billede af en hund; dette er et billede af en strand," fortæller programmet tager måske de samme billeder og siger: "Familien kom sammen til en madlavning; de havde en masse lækker mad; hunden var glad for at være der; de havde en stor tid på stranden; de havde endda en svømmetur i vandet."

I fremtiden kan computerstyret historiefortælling hjælpe folk med automatisk at generere fortællinger til diasshow af billeder, de uploader til sociale medier, sagde Mitchell. "Du vil hjælpe folk med at dele deres erfaringer, mens du reducerer det sarte arbejde, som nogle mennesker synes er ret kedeligt," sagde hun. Computerstyret historiefortælling "kan også hjælpe mennesker, der er svagtseende, til at åbne billeder for folk, der ikke kan se dem."

"Målet er at hjælpe med at give AI'er mere menneskelignende intelligens, for at hjælpe dem med at forstå ting på et mere abstrakt niveau - hvad det vil sige at være sjov eller uhyggelig eller mærkelig eller interessant," sagde seniorforfatter Margaret Mitchell, en computerforsker ved undersøgelsen. Microsoft Research. "Folk har videregivet historier i evigheder og brugt dem til at formidle vores moral, strategier og visdom. Med vores fokus på historiefortælling håber vi at hjælpe AI'er med at forstå menneskelige begreber på en måde, der er meget sikker og gavnlig for menneskeheden, i stedet for at lære den, hvordan man slår menneskeheden."

Hvis AI nogensinde lærer at fortælle historier baseret på sekvenser af billeder, "er det et springbræt i retning af at gøre det samme for video," sagde Mitchell. "Det kunne være med til at give interessante applikationer. For eksempel, for sikkerhedskameraer, vil du måske bare have et resumé af noget bemærkelsesværdigt, eller du kan automatisk live tweet-begivenheder," sagde hun.

Forskerne vil præsentere deres resultater i San Diego på det årlige møde i North American Chapter of Association for Computational Linguistics senere på måneden.

Mere om emnerne: ai, Microsoft-forskning