Conheça Sora, o novo modelo de texto para vídeo da OpenAI que cria vídeos HD impressionantes com base em instruções de texto
Não é uma questão de “podemos fazer isso”, mas de “devemos fazer”.
2 minutos. ler
Publicado em
Leia nossa página de divulgação para descobrir como você pode ajudar o MSPoweruser a sustentar a equipe editorial Saiba mais
Notas chave
- OpenAI acaba de anunciar um novo modelo de IA de texto para vídeo, Sora, e parece impressionante, mas assustador ao mesmo tempo.
- As pessoas estão agora preocupadas se este modelo irá assumir o controle dos seus empregos.
- O modelo transportará metadados C2PA, uma vez implementado em um produto OpenAI no futuro.
OpenAI acaba de anunciar um novo modelo de IA de texto para vídeo, Sora, e parece impressionante. A premissa parece bastante simples, mas notável: você pode digitar qualquer palavra, por mais detalhada que desejar, e então o modelo de IA retornará com um vídeo altamente detalhado de 60 segundos.
Dê uma olhada em alguns dos resultados que Sora poderia fazer:
Isso é honestamente assustador e impressionante ao mesmo tempo. A reacção pública a esta situação é uma mistura de admiração e alarme, especialmente considerando O passado legal da OpenAI disputas com empresas jornalísticas por supostamente usarem seus artigos para treinar a modelo sem o seu consentimento.
E também precisamos de falar sobre potenciais empregos que poderão ser substituídos. Até o próprio chefe da OpenAI, Sam Altman, que já foi destituído do cargo, disse que o ritmo de nossa pesquisa em IA tem sido avançando muito rápido e a quantidade de adaptação que a humanidade precisa de fazer é alarmante.
Este modelo baseia-se em pesquisas anteriores do DALL-E e GPT, usando o método exclusivo de recaptação do DALL-E 3 para gerar legendas extremamente descritivas para os dados de treinamento visual. No entanto, ainda enfrenta desafios na simulação realista de cenas complexas, na compreensão das relações de causa e efeito e na não confusão de detalhes espaciais de um prompt.
Quando implementado em um produto OpenAI no futuro, seja ChatGPT, uma nova oferta, ou Copilot, o modelo carregará metadados C2PA, semelhante ao que a Microsoft tem feito em Criador de imagens do Designer. As verificações de texto e imagem protegem os produtos OpenAI contra conteúdo prejudicial, como violência, discurso de ódio e violação de propriedade intelectual.
“Também estamos concedendo acesso a vários artistas visuais, designers e cineastas para obter feedback sobre como fazer o modelo avançar para ser mais útil para profissionais criativos”, diz OpenAI.