Op heterdaad betrapt: de hypocrisie van Google op het gebied van AI-training blootgelegd
2 minuut. lezen
Uitgegeven op
Lees onze openbaarmakingspagina om erachter te komen hoe u MSPoweruser kunt helpen het redactieteam te ondersteunen Lees meer
Belangrijkste opmerkingen
- De CEO van YouTube beschuldigt OpenAI ervan mogelijk de voorwaarden te schenden door AI te trainen met YouTube-video's.
- OpenAI zwijgt over specifieke gegevensbronnen voor hun AI-videogenerator Sora.
- Google beweert dat ze de contracten van makers respecteren en alleen openbaar beschikbare gegevens gebruiken met toestemming voor hun AI, Gemini.
YouTube-CEO Neal Mohan hekelt OpenAI en beschuldigt hen van het mogelijk schenden van de servicevoorwaarden door YouTube-video's te gebruiken om hun AI-videogenerator, Sora, te trainen. enkele maanden na de release. Hoewel Mohan toegeeft dat hij geen concreet bewijs heeft, benadrukt hij dat dergelijk gebruik duidelijk in strijd zou zijn met de regels van YouTube.
Deze beschuldiging komt te midden van een groeiend debat over de ethische bron van gegevens voor het trainen van AI-modellen. OpenAI heeft zijn lippen stijf op elkaar gehouden over de specifieke trainingsgegevensbronnen van Sora, maar bedrijven concurreren om de meeste inhoud te verzamelen die mogelijk is om hun AI-vooruitgang te stimuleren. Beiden staan momenteel aan de top van hun spel op het gebied van AI.
Vanuit het perspectief van een maker: wanneer een maker zijn harde werk naar ons platform uploadt, heeft hij/zij bepaalde verwachtingen. Eén van die verwachtingen is dat de servicevoorwaarden zullen worden nageleefd. Het staat niet toe dat zaken als transcripties of videofragmenten worden gedownload, en dat is een duidelijke schending van onze servicevoorwaarden. Dat zijn de verkeersregels als het gaat om content op ons platform.
Mohan verzekert het publiek dat Google bij het trainen van zijn eigen AI-model Gemini zich houdt aan individuele contracten met makers voordat YouTube-video's worden gebruikt; Het is behoorlijk hypocriet, nietwaar? Dit roept vragen op over de houding van Google ten aanzien van datagebruik: Google beschermt makers als het om concurrenten gaat, maar gebruikt vergelijkbare tactieken voor eigen voordeel.
Barry Schwartz heeft het correct samengevat:
Dit is hoe Google zijn LLM's zoals Gemini traint. Het verzamelt gegevens van websites, artikelen, boeken en andere inhoud. Complexe algoritmen analyseren de gegevens om het taalbegrip te verbeteren. Dit helpt AI-modellen taken uit te voeren zoals het nauwkeuriger vertalen van talen, het genereren van creatieve tekst en het beantwoorden van vragen.
Het valt nog te bezien of OpenAI inderdaad YouTube-inhoud aan het schrapen was, maar de situatie legt een potentiële dubbele standaard bloot binnen het ecosysteem van Google.
Meer hier.
Gebruikersforum
0 berichten