Studie visar att ChatGPT har mest copywritten data jämfört med andra topp LLMs

Hem » Nyheter

Lästid ikon 2 min. läsa

Kalenderikonen Publicerad den Mars 6, 2024

by Devesh Beri

publicerad den Mars 6, 2024

Läsare hjälper till att stödja MSpoweruser. Vi kan få en provision om du köper via våra länkar.

Viktiga anteckningar

AI-modeller som GPT-4 och Claude 2 visade sig generera text som innehåller upphovsrättsskyddat material.
OpenAI:s GPT-4 var den minst försiktiga, potentiellt intrång i upphovsrätten i 44 % av de testade uppmaningarna.

En ny studie av Patronus AI, ett företag som specialiserat sig på att utvärdera stora språkmodeller (LLM), har väckt oro över upphovsrättsintrång och användningen av upphovsrättsskyddad data för att träna AI-modeller. Forskningen, som släpptes på onsdagen, testade fyra AI-modeller: OpenAI:s GPT-4, Anthropics Claude 2, Metas Llama 2 och Mistral AI:s Mixtral. Förvånad över att de missade Tvillingarna

Patronus AI använde sin nyligen avslöjade "CopyrightCatcher” för att analysera modellernas svar på uppmaningar relaterade till populära upphovsrättsskyddade böcker. Utmaningen var enkel: uppmaningarna utmanade modellerna att antingen slutföra en bokpassage eller tillhandahålla den första delen av en specifik bok.

Alla fyra AI-modellerna producerade till viss del innehåll med upphovsrättsskyddat material.

OpenAI:s GPT-4 producerade det högsta antalet meddelanden (44 %) med upphovsrättsskyddad text.
Anthropics Claude 2 var den mest försiktiga, och genererade upphovsrättsskyddat innehåll i endast 16 % av slutföringsmeddelandena. Den vägrade också att svara på alla uppmaningar från första passagen, med hänvisning till sin brist på tillgång till upphovsrättsskyddat material. (Claude 3 släpptes nyligen, och Anhtropic är övertygad om att det är bättre än andra LLM:er)
Metas Llama 2 producerade upphovsrättsskyddat innehåll i 10 % av uppmaningarna.
Mistrals Mixtral visade en högre tendens att slutföra första passager (38 %) än större textbitar (6 %).

Patronus AI:s resultat kräver proaktiva åtgärder för att ta itu med upphovsrättsproblem och främja ansvarsfulla och etiska metoder för att innovation ska blomstra. Det hade varit bättre att lägga till Gemini i testet också.

Devesh Beri

Teknisk journalist

Det här är sakerna som motiverar mig - att skapa informativt och användbart innehåll, fortsätta min passion för motorsport och musik, delta i expeditioner, upprätthålla en hälsosam livsstil och umgås med min bedårande katt Taco.