Conheça Sora, o novo modelo de texto para vídeo da OpenAI que cria vídeos HD impressionantes com base em instruções de texto

Não é uma questão de “podemos fazer isso”, mas de “devemos fazer”.

Ícone de tempo de leitura 2 minutos. ler


Os leitores ajudam a oferecer suporte ao MSpoweruser. Podemos receber uma comissão se você comprar através de nossos links. Ícone de dica de ferramenta

Leia nossa página de divulgação para descobrir como você pode ajudar o MSPoweruser a sustentar a equipe editorial Saiba mais

Notas chave

  • OpenAI acaba de anunciar um novo modelo de IA de texto para vídeo, Sora, e parece impressionante, mas assustador ao mesmo tempo.
  • As pessoas estão agora preocupadas se este modelo irá assumir o controle dos seus empregos.
  • O modelo transportará metadados C2PA, uma vez implementado em um produto OpenAI no futuro.

OpenAI acaba de anunciar um novo modelo de IA de texto para vídeo, Sora, e parece impressionante. A premissa parece bastante simples, mas notável: você pode digitar qualquer palavra, por mais detalhada que desejar, e então o modelo de IA retornará com um vídeo altamente detalhado de 60 segundos. 

Dê uma olhada em alguns dos resultados que Sora poderia fazer:

Isso é honestamente assustador e impressionante ao mesmo tempo. A reacção pública a esta situação é uma mistura de admiração e alarme, especialmente considerando O passado legal da OpenAI disputas com empresas jornalísticas por supostamente usarem seus artigos para treinar a modelo sem o seu consentimento.

E também precisamos de falar sobre potenciais empregos que poderão ser substituídos. Até o próprio chefe da OpenAI, Sam Altman, que já foi destituído do cargo, disse que o ritmo de nossa pesquisa em IA tem sido avançando muito rápido e a quantidade de adaptação que a humanidade precisa de fazer é alarmante.

Este modelo baseia-se em pesquisas anteriores do DALL-E e GPT, usando o método exclusivo de recaptação do DALL-E 3 para gerar legendas extremamente descritivas para os dados de treinamento visual. No entanto, ainda enfrenta desafios na simulação realista de cenas complexas, na compreensão das relações de causa e efeito e na não confusão de detalhes espaciais de um prompt.

Quando implementado em um produto OpenAI no futuro, seja ChatGPT, uma nova oferta, ou Copilot, o modelo carregará metadados C2PA, semelhante ao que a Microsoft tem feito em Criador de imagens do Designer. As verificações de texto e imagem protegem os produtos OpenAI contra conteúdo prejudicial, como violência, discurso de ódio e violação de propriedade intelectual.

“Também estamos concedendo acesso a vários artistas visuais, designers e cineastas para obter feedback sobre como fazer o modelo avançar para ser mais útil para profissionais criativos”, diz OpenAI.