Google lança modelo de geração de vídeo Veo para mais clientes em meio ao recente vazamento do Sora da OpenAI

O Imagen 3 também está chegando ao Vertex AI

Ícone de tempo de leitura 2 minutos. ler


Os leitores ajudam a oferecer suporte ao MSpoweruser. Podemos receber uma comissão se você comprar através de nossos links. Ícone de dica de ferramenta

Leia nossa página de divulgação para descobrir como você pode ajudar o MSPoweruser a sustentar a equipe editorial Saiba mais

Notas chave

  • O Google lança o modelo de geração de vídeo Veo para a Vertex AI para empresas.
  • O modelo pode criar clipes de alta qualidade usando instruções de palavras ou imagens.
  • O gerador de imagens Imagen 3, que também alimenta o Gemini AI, também está chegando à plataforma.
Google Veo

O Google recentemente anunciou que seu modelo de geração de vídeo, Veo, agora está disponível no Vertex AI, a plataforma de aprendizado de máquina (ML) do Google Cloud para empresas.

Inicialmente lançado em maio 2024, o Veo pode gerar vídeos de alta qualidade a partir de prompts de texto ou imagem com ferramentas para prototipagem rápida e fluxo de trabalho mais fácil. O recurso em si agora está em visualização privada e o Google disse que está rolando “começando na próxima semana.”

Mas não está substituindo totalmente uma equipe de produção de vídeo. O Google também menciona que o Veo nada mais é do que um “grande parceiro para a criatividade humana” que ajuda a “lidar com aspectos tediosos ou repetitivos da produção de vídeo”.

“Como o primeiro hiperescalador a oferecer um modelo de imagem para vídeo, estamos ajudando as empresas a transformar seus ativos criativos existentes em visuais dinâmicos”, descreve o Google sobre o modelo Veo.

A mudança ocorreu pouco depois do OpenAI sofreu um “vazamento” (ou, talvez a melhor maneira de explicar isso seja uma “exposição”) do seu tão aguardado modelo Sora.

Um grupo de artistas expôs o front-end do Sora em protesto contra o trabalho não pago, o que significa que testadores não beta que não faziam parte do grupo selecionado da OpenAI poderiam experimentá-lo. Mas durou apenas três horas até que a empresa apoiada pela Microsoft o tirou do ar.

A gigante da tecnologia Mountain View também diz que o modelo de texto para imagem que alimenta o chatbot Gemini, Imagen 3, também está chegando à plataforma. O modelo teve um lançamento silencioso após preocupações com imagens historicamente imprecisas, tão ruins que o Google teve que pausar temporariamente.

A Imagem 3, que agora também está disponível no Google Docs, não permite a criação de “indivíduos fotorrealistas e identificáveis, representações de menores ou cenas excessivamente sangrentas, violentas ou sexuais”.

Fórum de usuários

Mensagens 0