Conheça Sora, o novo modelo de texto para vídeo da OpenAI que cria vídeos HD impressionantes com base em instruções de texto

Não é uma questão de “podemos fazer isso”, mas de “devemos fazer”.

2 minutos. ler

Publicado em 16 de fevereiro de 2024

publicado em 16 de fevereiro de 2024

Os leitores ajudam a oferecer suporte ao MSpoweruser. Podemos receber uma comissão se você comprar através de nossos links.

Notas chave

OpenAI acaba de anunciar um novo modelo de IA de texto para vídeo, Sora, e parece impressionante, mas assustador ao mesmo tempo.
As pessoas estão agora preocupadas se este modelo irá assumir o controle dos seus empregos.
O modelo transportará metadados C2PA, uma vez implementado em um produto OpenAI no futuro.

OpenAI acaba de anunciar um novo modelo de IA de texto para vídeo, Sora, e parece impressionante. A premissa parece bastante simples, mas notável: você pode digitar qualquer palavra, por mais detalhada que desejar, e então o modelo de IA retornará com um vídeo altamente detalhado de 60 segundos.

Dê uma olhada em alguns dos resultados que Sora poderia fazer:

Prompt: “Vários mamutes peludos gigantes se aproximam caminhando por um prado nevado, seu longo pelo lanoso balança levemente ao vento enquanto caminham, árvores cobertas de neve e montanhas cobertas de neve dramáticas ao longe, luz do meio da tarde com nuvens finas e um sol alto a distancia… pic.twitter.com/Um5CWI18nS
- OpenAI (@ OpenAI) 15 de fevereiro de 2024

Prompt: “Um trailer de filme apresentando as aventuras do homem espacial de 30 anos usando um capacete de motocicleta tricotado de lã vermelha, céu azul, deserto de sal, estilo cinematográfico, filmado em filme 35mm, cores vivas.” pic.twitter.com/0JzpwPUGPB
- OpenAI (@ OpenAI) 15 de fevereiro de 2024

Prompt: “Um mundo de papel artesanal maravilhosamente renderizado de um recife de coral, repleto de peixes coloridos e criaturas marinhas.” pic.twitter.com/gzEE8SwP81
- OpenAI (@ OpenAI) 15 de fevereiro de 2024

Dica: “A cena animada apresenta um close-up de um monstro pequeno e fofo ajoelhado ao lado de uma vela vermelha derretida. o estilo artístico é 3D e realista, com foco em iluminação e textura. o clima da pintura é de admiração e curiosidade, enquanto o monstro olha para a chama com… pic.twitter.com/aLMgJPI0y6
- OpenAI (@ OpenAI) 15 de fevereiro de 2024

Isso é honestamente assustador e impressionante ao mesmo tempo. A reacção pública a esta situação é uma mistura de admiração e alarme, especialmente considerando O passado legal da OpenAI disputas com empresas jornalísticas por supostamente usarem seus artigos para treinar a modelo sem o seu consentimento.

E também precisamos de falar sobre potenciais empregos que poderão ser substituídos. Até o próprio chefe da OpenAI, Sam Altman, que já foi destituído do cargo, disse que o ritmo de nossa pesquisa em IA tem sido avançando muito rápido e a quantidade de adaptação que a humanidade precisa de fazer é alarmante.

Este modelo baseia-se em pesquisas anteriores do DALL-E e GPT, usando o método exclusivo de recaptação do DALL-E 3 para gerar legendas extremamente descritivas para os dados de treinamento visual. No entanto, ainda enfrenta desafios na simulação realista de cenas complexas, na compreensão das relações de causa e efeito e na não confusão de detalhes espaciais de um prompt.

Quando implementado em um produto OpenAI no futuro, seja ChatGPT, uma nova oferta, ou Copilot, o modelo carregará metadados C2PA, semelhante ao que a Microsoft tem feito em Criador de imagens do Designer. As verificações de texto e imagem protegem os produtos OpenAI contra conteúdo prejudicial, como violência, discurso de ódio e violação de propriedade intelectual.

“Também estamos concedendo acesso a vários artistas visuais, designers e cineastas para obter feedback sobre como fazer o modelo avançar para ser mais útil para profissionais criativos”, diz OpenAI.

Rafly Gilang

Repórter Técnico

Rafly é um repórter com anos de experiência jornalística, abrangendo áreas de tecnologia, negócios, social e cultura. Atualmente reportando notícias sobre produtos, tecnologia e IA relacionados à Microsoft no Windows Report e MSPowerUser. Tem uma dica? Envie para [email protegido].