Исследование показывает, что ChatGPT имеет больше всего копирайтинговых данных по сравнению с другими ведущими LLM.

Значок времени чтения 2 минута. читать


Читатели помогают поддержать MSpoweruser. Мы можем получить комиссию, если вы совершите покупку по нашим ссылкам. Значок подсказки

Прочтите нашу страницу раскрытия информации, чтобы узнать, как вы можете помочь MSPoweruser поддержать редакционную команду. Читать далее

Ключевые заметки

  • Было обнаружено, что модели искусственного интеллекта, такие как GPT-4 и Claude 2, генерируют текст, содержащий материалы, защищенные авторским правом.
  • GPT-4 от OpenAI оказался наименее осторожным и потенциально нарушал авторские права в 44% протестированных подсказок.

Новое исследование Patronus AI, компании, специализирующейся на оценке больших языковых моделей (LLM), вызвало обеспокоенность по поводу нарушения авторских прав и использования данных, защищенных авторским правом, при обучении моделей ИИ. В исследовании, опубликованном в среду, были протестированы четыре модели искусственного интеллекта: GPT-4 от OpenAI, Claude 2 от Anthropic, Llama 2 от Meta и Mixtral от Mistral AI. Удивлен, что они пропустили Близнецов.

Патронус ИИ использовал свои недавно обнаруженные «CopyrightCatcher», чтобы проанализировать ответы моделей на подсказки, связанные с популярными книгами, защищенными авторским правом. Задача была простой: подсказки предлагали моделям либо завершить отрывок из книги, либо предоставить первый отрывок конкретной книги.

 Все четыре модели ИИ в той или иной степени создавали контент, содержащий материалы, защищенные авторским правом.

  • GPT-4 от OpenAI выдал наибольшее количество подсказок (44%) с текстом, защищенным авторским правом.
  • Claude 2 от Anthropic был самым осторожным: контент, защищенный авторским правом, создавался только в 16% запросов на завершение. Он также отказался отвечать на все запросы первого прохода, сославшись на отсутствие доступа к материалам, защищенным авторским правом. (Клод 3 недавно вышел., и Anhtropic уверен, что это лучше, чем у других LLM)
  • Llama 2 от Meta создавала контент, защищенный авторским правом, в 10% запросов.
  • Mixtral от Mistral продемонстрировал более высокую склонность к завершению первых отрывков (38%), чем более крупные фрагменты текста (6%).

Выводы Patronus AI призывают к активным шагам по решению проблем авторского права и продвижению ответственных и этических практик для процветания инноваций. Было бы лучше добавить к тесту и Gemini.