Badanie pokazuje, że ChatGPT ma najwięcej skopiowanych danych w porównaniu do innych najlepszych LLM

Ikona czasu czytania 2 minuta. czytać


Czytelnicy pomagają wspierać MSpoweruser. Możemy otrzymać prowizję, jeśli dokonasz zakupu za pośrednictwem naszych linków. Ikona podpowiedzi

Przeczytaj naszą stronę z informacjami, aby dowiedzieć się, jak możesz pomóc MSPoweruser w utrzymaniu zespołu redakcyjnego Czytaj więcej

Kluczowe uwagi

  • Stwierdzono, że modele sztucznej inteligencji, takie jak GPT-4 i Claude 2, generują tekst zawierający materiały chronione prawem autorskim.
  • GPT-4 OpenAI był najmniej ostrożny i potencjalnie naruszał prawa autorskie w 44% przetestowanych podpowiedzi.

Nowe badanie przeprowadzone przez Patronus AI, firmę specjalizującą się w ocenie dużych modeli językowych (LLM), wzbudziło obawy dotyczące naruszenia praw autorskich i wykorzystania danych objętych prawami autorskimi w modelach szkoleniowych AI. W opublikowanym w środę badaniu przetestowano cztery modele sztucznej inteligencji: GPT-4 firmy OpenAI, Claude 2 firmy Anthropic, Llama 2 firmy Meta i Mixtral AI firmy Mistral. Zaskoczony, że przegapili Bliźnięta

Patronus AI wykorzystał nowo ujawnione „Prawa autorskieCatcher”, aby przeanalizować reakcje modelek na podpowiedzi dotyczące popularnych książek chronionych prawem autorskim. Wyzwanie było proste: podpowiedzi wymagały od modeli ukończenia fragmentu książki lub przedstawienia pierwszego fragmentu określonej książki.

 Wszystkie cztery modele sztucznej inteligencji tworzyły w pewnym stopniu treści zawierające materiały chronione prawem autorskim.

  • GPT-4 OpenAI wygenerowało największą liczbę podpowiedzi (44%) z tekstem chronionym prawem autorskim.
  • Najbardziej ostrożny był projekt Claude 2 firmy Anthropic, który wygenerował treści chronione prawem autorskim jedynie w 16% wezwań do ukończenia. Odmówiła także odpowiedzi na wszystkie pytania zawarte w pierwszym fragmencie, powołując się na brak dostępu do materiałów chronionych prawem autorskim. (Niedawno ukazał się Claude 3, a Anhtropic jest pewien, że jest lepszy niż inne LLM)
  • Meta's Lama 2 wygenerowała treści chronione prawem autorskim w 10% podpowiedzi.
  • Mixtral firmy Mistral wykazywał większą tendencję do kończenia pierwszych fragmentów (38%) niż większe fragmenty tekstu (6%).

Ustalenia projektu Patronus AI wzywają do podjęcia proaktywnych kroków w celu rozwiązania problemów związanych z prawami autorskimi oraz promowania odpowiedzialnych i etycznych praktyk, aby innowacje mogły się rozwijać. Lepiej byłoby dodać do testu także Gemini.