Studie visar att ChatGPT har mest copywritten data jämfört med andra topp LLMs

Lästid ikon 2 min. läsa


Läsare hjälper till att stödja MSpoweruser. Vi kan få en provision om du köper via våra länkar. Verktygstipsikon

Läs vår informationssida för att ta reda på hur du kan hjälpa MSPoweruser upprätthålla redaktionen Läs mer

Viktiga anteckningar

  • AI-modeller som GPT-4 och Claude 2 visade sig generera text som innehåller upphovsrättsskyddat material.
  • OpenAI:s GPT-4 var den minst försiktiga, potentiellt intrång i upphovsrätten i 44 % av de testade uppmaningarna.

En ny studie av Patronus AI, ett företag som specialiserat sig på att utvärdera stora språkmodeller (LLM), har väckt oro över upphovsrättsintrång och användningen av upphovsrättsskyddad data för att träna AI-modeller. Forskningen, som släpptes på onsdagen, testade fyra AI-modeller: OpenAI:s GPT-4, Anthropics Claude 2, Metas Llama 2 och Mistral AI:s Mixtral. Förvånad över att de missade Tvillingarna

Patronus AI använde sin nyligen avslöjade "CopyrightCatcher” för att analysera modellernas svar på uppmaningar relaterade till populära upphovsrättsskyddade böcker. Utmaningen var enkel: uppmaningarna utmanade modellerna att antingen slutföra en bokpassage eller tillhandahålla den första delen av en specifik bok.

 Alla fyra AI-modellerna producerade till viss del innehåll med upphovsrättsskyddat material.

  • OpenAI:s GPT-4 producerade det högsta antalet meddelanden (44 %) med upphovsrättsskyddad text.
  • Anthropics Claude 2 var den mest försiktiga, och genererade upphovsrättsskyddat innehåll i endast 16 % av slutföringsmeddelandena. Den vägrade också att svara på alla uppmaningar från första passagen, med hänvisning till sin brist på tillgång till upphovsrättsskyddat material. (Claude 3 släpptes nyligen, och Anhtropic är övertygad om att det är bättre än andra LLM:er)
  • Metas Llama 2 producerade upphovsrättsskyddat innehåll i 10 % av uppmaningarna.
  • Mistrals Mixtral visade en högre tendens att slutföra första passager (38 %) än större textbitar (6 %).

Patronus AI:s resultat kräver proaktiva åtgärder för att ta itu med upphovsrättsproblem och främja ansvarsfulla och etiska metoder för att innovation ska blomstra. Det hade varit bättre att lägga till Gemini i testet också.