På bar gärning: Googles hyckleri när det gäller AI-träning avslöjat

Lästid ikon 2 min. läsa


Läsare hjälper till att stödja MSpoweruser. Vi kan få en provision om du köper via våra länkar. Verktygstipsikon

Läs vår informationssida för att ta reda på hur du kan hjälpa MSPoweruser upprätthålla redaktionen Läs mer

Viktiga anteckningar

  • YouTubes VD anklagar OpenAI för att potentiellt bryta mot villkor genom att träna AI med YouTube-videor.
  • OpenAI förblir tyst om specifika datakällor för deras AI-videogenerator, Sora.
  • Google hävdar att de respekterar kreatörskontrakt och endast använder offentligt tillgänglig data med tillstånd för sin AI, Gemini.
Google kontor

YouTubes vd Neal Mohan kritiserar OpenAI och anklagar dem för att potentiellt bryta mot användarvillkoren genom att använda YouTube-videor för att träna sin AI-videogenerator, Sora, som är en några månader innan den släpptes. Även om Mohan medger att han inte har några konkreta bevis, betonar han att sådan användning helt klart skulle bryta mot YouTubes regler.

Denna anklagelse kommer mitt i en växande debatt om den etiska insamlingen av data för att träna AI-modeller. OpenAI har varit tystlåten om Soras specifika träningsdatakällor, men företag tävlar om att samla in så mycket innehåll som möjligt för att driva på deras AI-framsteg. Båda är för närvarande i toppen av sitt spel inom AI.

Ur en kreatörs perspektiv, när en kreatör laddar upp sitt hårda arbete till vår plattform, har de vissa förväntningar. En av dessa förväntningar är att användarvillkoren kommer att följas. Det tillåter inte att saker som transkriptioner eller videobitar laddas ner, och det är ett tydligt brott mot våra användarvillkor. Det är trafikreglerna när det gäller innehåll på vår plattform.

Mohan försäkrar allmänheten att när Google tränar sin egen AI-modell Gemini, följer Google individuella kontrakt med kreatörer innan de använder några YouTube-videor; det är ganska hycklande, eller hur? Detta väcker frågor om Googles inställning till dataanvändning – det skyddar skapare när det kommer till konkurrenter men använder liknande taktik för sin egen fördel.

Barry Schwartz har sammanfattat det korrekt:

Så här tränar Google sina LLM:er som Gemini. Den samlar in data från webbplatser, artiklar, böcker och annat innehåll. Komplexa algoritmer analyserar data för att förbättra språkförståelsen. Detta hjälper AI-modeller att utföra uppgifter som att översätta språk mer exakt, skapa kreativ text och svara på frågor.

Det återstår att se om OpenAI verkligen skrapade YouTube-innehåll, men situationen avslöjar en potentiell dubbelmoral inom Googles ekosystem.

Snarare här..

Användarforum

0 meddelanden