Google lança modelo de geração de vídeo Veo para mais clientes em meio ao recente vazamento do Sora da OpenAI
O Imagen 3 também está chegando ao Vertex AI
2 minutos. ler
Publicado em
Leia nossa página de divulgação para descobrir como você pode ajudar o MSPoweruser a sustentar a equipe editorial Saiba mais
Notas chave
- O Google lança o modelo de geração de vídeo Veo para a Vertex AI para empresas.
- O modelo pode criar clipes de alta qualidade usando instruções de palavras ou imagens.
- O gerador de imagens Imagen 3, que também alimenta o Gemini AI, também está chegando à plataforma.
O Google recentemente anunciou que seu modelo de geração de vídeo, Veo, agora está disponível no Vertex AI, a plataforma de aprendizado de máquina (ML) do Google Cloud para empresas.
Inicialmente lançado em maio 2024, o Veo pode gerar vídeos de alta qualidade a partir de prompts de texto ou imagem com ferramentas para prototipagem rápida e fluxo de trabalho mais fácil. O recurso em si agora está em visualização privada e o Google disse que está rolando “começando na próxima semana.”
Mas não está substituindo totalmente uma equipe de produção de vídeo. O Google também menciona que o Veo nada mais é do que um “grande parceiro para a criatividade humana” que ajuda a “lidar com aspectos tediosos ou repetitivos da produção de vídeo”.
“Como o primeiro hiperescalador a oferecer um modelo de imagem para vídeo, estamos ajudando as empresas a transformar seus ativos criativos existentes em visuais dinâmicos”, descreve o Google sobre o modelo Veo.
A mudança ocorreu pouco depois do OpenAI sofreu um “vazamento” (ou, talvez a melhor maneira de explicar isso seja uma “exposição”) do seu tão aguardado modelo Sora.
Um grupo de artistas expôs o front-end do Sora em protesto contra o trabalho não pago, o que significa que testadores não beta que não faziam parte do grupo selecionado da OpenAI poderiam experimentá-lo. Mas durou apenas três horas até que a empresa apoiada pela Microsoft o tirou do ar.
A gigante da tecnologia Mountain View também diz que o modelo de texto para imagem que alimenta o chatbot Gemini, Imagen 3, também está chegando à plataforma. O modelo teve um lançamento silencioso após preocupações com imagens historicamente imprecisas, tão ruins que o Google teve que pausar temporariamente.
A Imagem 3, que agora também está disponível no Google Docs, não permite a criação de “indivíduos fotorrealistas e identificáveis, representações de menores ou cenas excessivamente sangrentas, violentas ou sexuais”.
Fórum de usuários
Mensagens 0