Badanie pokazuje, że ChatGPT ma najwięcej skopiowanych danych w porównaniu do innych najlepszych LLM

Ikona czasu czytania 2 minuta. czytać

Ikona kalendarza Opublikowany 6 marca 2024 r.

opublikowane w dniu 6 marca 2024 r.

Czytelnicy pomagają wspierać MSpoweruser. Możemy otrzymać prowizję, jeśli dokonasz zakupu za pośrednictwem naszych linków.

Kluczowe uwagi

Stwierdzono, że modele sztucznej inteligencji, takie jak GPT-4 i Claude 2, generują tekst zawierający materiały chronione prawem autorskim.
GPT-4 OpenAI był najmniej ostrożny i potencjalnie naruszał prawa autorskie w 44% przetestowanych podpowiedzi.

Nowe badanie przeprowadzone przez Patronus AI, firmę specjalizującą się w ocenie dużych modeli językowych (LLM), wzbudziło obawy dotyczące naruszenia praw autorskich i wykorzystania danych objętych prawami autorskimi w modelach szkoleniowych AI. W opublikowanym w środę badaniu przetestowano cztery modele sztucznej inteligencji: GPT-4 firmy OpenAI, Claude 2 firmy Anthropic, Llama 2 firmy Meta i Mixtral AI firmy Mistral. Zaskoczony, że przegapili Bliźnięta

Patronus AI wykorzystał nowo ujawnione „Prawa autorskieCatcher”, aby przeanalizować reakcje modelek na podpowiedzi dotyczące popularnych książek chronionych prawem autorskim. Wyzwanie było proste: podpowiedzi wymagały od modeli ukończenia fragmentu książki lub przedstawienia pierwszego fragmentu określonej książki.

Wszystkie cztery modele sztucznej inteligencji tworzyły w pewnym stopniu treści zawierające materiały chronione prawem autorskim.

GPT-4 OpenAI wygenerowało największą liczbę podpowiedzi (44%) z tekstem chronionym prawem autorskim.
Najbardziej ostrożny był projekt Claude 2 firmy Anthropic, który wygenerował treści chronione prawem autorskim jedynie w 16% wezwań do ukończenia. Odmówiła także odpowiedzi na wszystkie pytania zawarte w pierwszym fragmencie, powołując się na brak dostępu do materiałów chronionych prawem autorskim. (Niedawno ukazał się Claude 3, a Anhtropic jest pewien, że jest lepszy niż inne LLM)
Meta's Lama 2 wygenerowała treści chronione prawem autorskim w 10% podpowiedzi.
Mixtral firmy Mistral wykazywał większą tendencję do kończenia pierwszych fragmentów (38%) niż większe fragmenty tekstu (6%).

Ustalenia projektu Patronus AI wzywają do podjęcia proaktywnych kroków w celu rozwiązania problemów związanych z prawami autorskimi oraz promowania odpowiedzialnych i etycznych praktyk, aby innowacje mogły się rozwijać. Lepiej byłoby dodać do testu także Gemini.

Devesh Beri

Dziennikarz techniczny

To mnie motywuje – tworzenie przydatnych i informacyjnych treści, realizowanie swojej pasji do sportów motorowych i muzyki, organizowanie wypraw, prowadzenie zdrowego trybu życia i spędzanie czasu z moim uroczym kotem Taco.