Spoznajte Soro, nov model besedila v video OpenAI, ki ustvarja osupljive HD videoposnetke na podlagi besedilnih pozivov

Ne gre za vprašanje "ali lahko to storimo," ampak "ali naj to storimo."

Ikona časa branja 2 min. prebrati


Bralci pomagajo pri podpori MSpoweruser. Če kupujete prek naših povezav, lahko prejmemo provizijo. Ikona opisa orodja

Preberite našo stran za razkritje, če želite izvedeti, kako lahko pomagate MSPoweruser vzdrževati uredniško skupino Preberi več

Ključne opombe

  • OpenAI je pravkar napovedal nov model umetne inteligence za pretvorbo besedila v video, Sora, in izgleda impresivno, a hkrati strašljivo.
  • Ljudje so zdaj zaskrbljeni, ali bo ta model prevzel njihova delovna mesta.
  • Model bo prenašal metapodatke C2PA, ko bo v prihodnosti implementiran v izdelek OpenAI.

OpenAI je pravkar napovedal nov model AI za pretvorbo besedila v video, Sora, in izgleda impresivno. Predpostavka je videti precej preprosta, a izjemna: vtipkate lahko poljubne besedne pozive, ne glede na podrobnosti, ki jih želite, nato pa se model AI vrne s 60-sekundnim zelo podrobnim videoposnetkom. 

Oglejte si nekaj rezultatov, ki bi jih lahko dosegla Sora:

To je pošteno strašljivo in impresivno hkrati. Odziv javnosti na to je mešanica strahospoštovanja in preplaha, še posebej če upoštevamo Preteklost OpenAI-ja spore z novinarskimi podjetji zaradi domnevne uporabe njihovih člankov za urjenje manekenke brez njihove privolitve.

Pogovarjati se moramo tudi o potencialnih delovnih mestih, ki bi jih lahko nadomestili. Celo sam šef OpenAI Sam Altman, ki je bil nekoč odstavljen s položaja, je dejal, da je hitrost naših raziskav AI prehitro napreduje količina prilagajanja, ki jo mora narediti človeštvo, pa je alarmantna.

Ta model temelji na preteklih raziskavah DALL-E in GPT z uporabo edinstvene metode recaptioninga DALL-E 3 za ustvarjanje izjemno opisnih napisov za podatke vizualnega usposabljanja. vendar še vedno se sooča z izzivi v realističnem simuliranju zapletenih prizorov, razumevanju vzročno-posledičnih razmerij in ne zamenjavi prostorskih podrobnosti poziva.

Ko bo v prihodnosti implementiran v izdelek OpenAI, naj bo to ChatGPT, nova ponudba ali Copilot, bo model nosil metapodatke C2PA, podobno kot je Microsoft počel Image Creator iz Designerja. Preverjanje besedila in slik ščiti izdelke OpenAI pred škodljivo vsebino, kot je nasilje, sovražni govor in kršitev IP.

»Omogočamo tudi dostop številnim vizualnim umetnikom, oblikovalcem in filmskim ustvarjalcem, da pridobijo povratne informacije o tem, kako izboljšati model, da bo najbolj koristen za ustvarjalne strokovnjake,« pravi OpenAI.