Die Studie zeigt, dass ChatGPT im Vergleich zu anderen Top-LLMs über die meisten kopierten Daten verfügt

Symbol für die Lesezeit 2 Minute. lesen


Leser unterstützen MSpoweruser. Wir erhalten möglicherweise eine Provision, wenn Sie über unsere Links kaufen. Tooltip-Symbol

Lesen Sie unsere Offenlegungsseite, um herauszufinden, wie Sie MSPoweruser dabei helfen können, das Redaktionsteam zu unterstützen Lesen Sie weiter

Wichtige Hinweise

  • Es wurde festgestellt, dass KI-Modelle wie GPT-4 und Claude 2 Texte generieren, die urheberrechtlich geschütztes Material enthalten.
  • GPT-4 von OpenAI war am wenigsten vorsichtig und verstieß möglicherweise in 44 % der getesteten Eingabeaufforderungen gegen Urheberrechte.

Eine neue Studie von Patronus AI, einem auf die Bewertung großer Sprachmodelle (LLMs) spezialisierten Unternehmen, hat Bedenken hinsichtlich Urheberrechtsverletzungen und der Verwendung urheberrechtlich geschützter Daten beim Training von KI-Modellen geweckt. Die am Mittwoch veröffentlichte Studie testete vier KI-Modelle: GPT-4 von OpenAI, Claude 2 von Anthropic, Llama 2 von Meta und Mixtral von Mistral AI. Überrascht, dass sie die Zwillinge verpasst haben

Patronus AI nutzte ihr neu enthülltes „CopyrightCatcher” um die Reaktionen der Modelle auf Aufforderungen zu beliebten urheberrechtlich geschützten Büchern zu analysieren. Die Herausforderung war einfach: Die Aufforderungen forderten die Modelle dazu auf, entweder eine Buchpassage zu vervollständigen oder die erste Passage eines bestimmten Buches bereitzustellen.

 Alle vier KI-Modelle produzierten bis zu einem gewissen Grad Inhalte mit urheberrechtlich geschütztem Material.

  • GPT-4 von OpenAI erzeugte die höchste Anzahl an Eingabeaufforderungen (44 %) mit urheberrechtlich geschütztem Text.
  • Claude 2 von Anthropic war am vorsichtigsten und generierte nur in 16 % der Abschlussaufforderungen urheberrechtlich geschützte Inhalte. Außerdem lehnte es die Beantwortung aller ersten Fragen mit der Begründung ab, es habe keinen Zugang zu urheberrechtlich geschütztem Material. (Claude 3 wurde kürzlich veröffentlicht, und Anhtropic ist zuversichtlich, dass es besser ist als andere LLMs)
  • Meta's Llama 2 produzierte in 10 % der Eingabeaufforderungen urheberrechtlich geschützte Inhalte.
  • Mistrals Mixtral zeigte eine höhere Tendenz, erste Passagen fertigzustellen (38 %), als größere Textabschnitte (6 %).

Die Ergebnisse von Patronus AI erfordern proaktive Schritte, um Urheberrechtsbedenken auszuräumen und verantwortungsvolle und ethische Praktiken zu fördern, damit Innovationen gedeihen können. Es wäre besser gewesen, auch Gemini zum Test hinzuzufügen. 

Hinterlassen Sie uns einen Kommentar

E-Mail-Adresse wird nicht veröffentlicht. Pflichtfelder sind MIT * gekennzeichnet. *