Pego em flagrante: a hipocrisia do Google no treinamento de IA exposta

Ícone de tempo de leitura 2 minutos. ler


Os leitores ajudam a oferecer suporte ao MSpoweruser. Podemos receber uma comissão se você comprar através de nossos links. Ícone de dica de ferramenta

Leia nossa página de divulgação para descobrir como você pode ajudar o MSPoweruser a sustentar a equipe editorial Saiba mais

Notas chave

  • O CEO do YouTube acusa a OpenAI de potencialmente violar os termos ao treinar IA com vídeos do YouTube.
  • OpenAI permanece em silêncio sobre fontes de dados específicas para seu gerador de vídeo de IA, Sora.
  • O Google afirma que respeita os contratos dos criadores e só usa dados disponíveis publicamente com permissão para sua IA, Gemini.
Escritório do Google

O CEO do YouTube, Neal Mohan, critica a OpenAI, acusando-a de potencialmente violar os termos de serviço ao usar vídeos do YouTube para treinar seu gerador de vídeo de IA, Sora, que é um poucos meses antes de seu lançamento. Embora Mohan admita que não tem provas concretas, ele enfatiza que tal uso violaria claramente as regras do YouTube.

Esta acusação surge no meio de um debate crescente sobre a origem ética de dados para a formação de modelos de IA. A OpenAI permaneceu calada sobre as fontes de dados de treinamento específicas da Sora, mas as empresas competem para reunir o máximo de conteúdo possível para alimentar seus avanços em IA. Ambos estão atualmente no topo de seu jogo no campo da IA.

Do ponto de vista de um criador, quando um criador carrega seu trabalho duro em nossa plataforma, ele tem certas expectativas. Uma dessas expectativas é que os termos de serviço sejam cumpridos. Ele não permite o download de itens como transcrições ou bits de vídeo, o que é uma clara violação de nossos termos de serviço. Essas são as regras em termos de conteúdo da nossa plataforma.

Mohan garante ao público que ao treinar seu próprio modelo de IA Gemini, o Google adere a contratos individuais com os criadores antes de usar qualquer vídeo do YouTube; é bastante hipócrita, não é? Isto levanta questões sobre a posição do Google em relação ao uso de dados – ele protege os criadores quando se trata de concorrentes, mas utiliza táticas semelhantes para seu próprio benefício.

Barry Schwartz resumiu corretamente:

É assim que o Google treina seus LLMs como o Gemini. Ele coleta dados de sites, artigos, livros e outros conteúdos. Algoritmos complexos analisam os dados para melhorar a compreensão da linguagem. Isso ajuda os modelos de IA a realizar tarefas como traduzir idiomas com mais precisão, gerar textos criativos e responder perguntas.

Resta saber se a OpenAI estava realmente roubando o conteúdo do YouTube, mas a situação expõe um potencial duplo padrão dentro do ecossistema do Google.

Mais aqui.

Fórum de usuários

Mensagens 0