Badanie pokazuje, że ChatGPT ma najwięcej skopiowanych danych w porównaniu do innych najlepszych LLM
2 minuta. czytać
Opublikowany
Przeczytaj naszą stronę z informacjami, aby dowiedzieć się, jak możesz pomóc MSPoweruser w utrzymaniu zespołu redakcyjnego Czytaj więcej
Kluczowe uwagi
- Stwierdzono, że modele sztucznej inteligencji, takie jak GPT-4 i Claude 2, generują tekst zawierający materiały chronione prawem autorskim.
- GPT-4 OpenAI był najmniej ostrożny i potencjalnie naruszał prawa autorskie w 44% przetestowanych podpowiedzi.
Nowe badanie przeprowadzone przez Patronus AI, firmę specjalizującą się w ocenie dużych modeli językowych (LLM), wzbudziło obawy dotyczące naruszenia praw autorskich i wykorzystania danych objętych prawami autorskimi w modelach szkoleniowych AI. W opublikowanym w środę badaniu przetestowano cztery modele sztucznej inteligencji: GPT-4 firmy OpenAI, Claude 2 firmy Anthropic, Llama 2 firmy Meta i Mixtral AI firmy Mistral. Zaskoczony, że przegapili Bliźnięta
Patronus AI wykorzystał nowo ujawnione „Prawa autorskieCatcher”, aby przeanalizować reakcje modelek na podpowiedzi dotyczące popularnych książek chronionych prawem autorskim. Wyzwanie było proste: podpowiedzi wymagały od modeli ukończenia fragmentu książki lub przedstawienia pierwszego fragmentu określonej książki.
Wszystkie cztery modele sztucznej inteligencji tworzyły w pewnym stopniu treści zawierające materiały chronione prawem autorskim.
- GPT-4 OpenAI wygenerowało największą liczbę podpowiedzi (44%) z tekstem chronionym prawem autorskim.
- Najbardziej ostrożny był projekt Claude 2 firmy Anthropic, który wygenerował treści chronione prawem autorskim jedynie w 16% wezwań do ukończenia. Odmówiła także odpowiedzi na wszystkie pytania zawarte w pierwszym fragmencie, powołując się na brak dostępu do materiałów chronionych prawem autorskim. (Niedawno ukazał się Claude 3, a Anhtropic jest pewien, że jest lepszy niż inne LLM)
- Meta's Lama 2 wygenerowała treści chronione prawem autorskim w 10% podpowiedzi.
- Mixtral firmy Mistral wykazywał większą tendencję do kończenia pierwszych fragmentów (38%) niż większe fragmenty tekstu (6%).
Ustalenia projektu Patronus AI wzywają do podjęcia proaktywnych kroków w celu rozwiązania problemów związanych z prawami autorskimi oraz promowania odpowiedzialnych i etycznych praktyk, aby innowacje mogły się rozwijać. Lepiej byłoby dodać do testu także Gemini.