På bar gärning: Googles hyckleri när det gäller AI-träning avslöjat

Home » Nyheter

2 min. läsa

Publicerad den 5 april 2024

by Devesh Beri

publicerad den 5 april 2024

Dela den här artikeln

Förbättra den här guiden

Läsare hjälper till att stödja MSpoweruser. Vi kan få en provision om du köper via våra länkar.

Viktiga anteckningar

YouTubes VD anklagar OpenAI för att potentiellt bryta mot villkor genom att träna AI med YouTube-videor.
OpenAI förblir tyst om specifika datakällor för deras AI-videogenerator, Sora.
Google hävdar att de respekterar kreatörskontrakt och endast använder offentligt tillgänglig data med tillstånd för sin AI, Gemini.

YouTubes vd Neal Mohan kritiserar OpenAI och anklagar dem för att potentiellt bryta mot användarvillkoren genom att använda YouTube-videor för att träna sin AI-videogenerator, Sora, som är en några månader innan den släpptes. Även om Mohan medger att han inte har några konkreta bevis, betonar han att sådan användning helt klart skulle bryta mot YouTubes regler.

Denna anklagelse kommer mitt i en växande debatt om den etiska insamlingen av data för att träna AI-modeller. OpenAI har varit tystlåten om Soras specifika träningsdatakällor, men företag tävlar om att samla in så mycket innehåll som möjligt för att driva på deras AI-framsteg. Båda är för närvarande i toppen av sitt spel inom AI.

Ur en kreatörs perspektiv, när en kreatör laddar upp sitt hårda arbete till vår plattform, har de vissa förväntningar. En av dessa förväntningar är att användarvillkoren kommer att följas. Det tillåter inte att saker som transkriptioner eller videobitar laddas ner, och det är ett tydligt brott mot våra användarvillkor. Det är trafikreglerna när det gäller innehåll på vår plattform.

Mohan försäkrar allmänheten att när Google tränar sin egen AI-modell Gemini, följer Google individuella kontrakt med kreatörer innan de använder några YouTube-videor; det är ganska hycklande, eller hur? Detta väcker frågor om Googles inställning till dataanvändning – det skyddar skapare när det kommer till konkurrenter men använder liknande taktik för sin egen fördel.

Barry Schwartz har sammanfattat det korrekt:

Google till utgivare – vi kan använda ditt innehåll för att träna våra sökmotorer och AI
Google till OpenAI – du kan inte använda YouTube för att träna din AI https://t.co/iEUsGlov14
- Barry Schwartz (@rustybrick) 4 april 2024

Så här tränar Google sina LLM:er som Gemini. Den samlar in data från webbplatser, artiklar, böcker och annat innehåll. Komplexa algoritmer analyserar data för att förbättra språkförståelsen. Detta hjälper AI-modeller att utföra uppgifter som att översätta språk mer exakt, skapa kreativ text och svara på frågor.

Det återstår att se om OpenAI verkligen skrapade YouTube-innehåll, men situationen avslöjar en potentiell dubbelmoral inom Googles ekosystem.

Snarare här..

Devesh Beri

Teknisk journalist

Det här är sakerna som motiverar mig - att skapa informativt och användbart innehåll, fortsätta min passion för motorsport och musik, delta i expeditioner, upprätthålla en hälsosam livsstil och umgås med min bedårande katt Taco.

Användarforum

0 meddelanden

Sortera efter:

Kommentera uppropet Avbryt svar