Исследование показывает, что ChatGPT имеет больше всего копирайтинговых данных по сравнению с другими ведущими LLM.

Главная » Новости

Значок времени чтения 2 минута. читать

Значок календаря Опубликовано 6 марта 2024

by Девеш Бери

Опубликован в 6 марта 2024

Читатели помогают поддержать MSpoweruser. Мы можем получить комиссию, если вы совершите покупку по нашим ссылкам.

Ключевые заметки

Было обнаружено, что модели искусственного интеллекта, такие как GPT-4 и Claude 2, генерируют текст, содержащий материалы, защищенные авторским правом.
GPT-4 от OpenAI оказался наименее осторожным и потенциально нарушал авторские права в 44% протестированных подсказок.

Новое исследование Patronus AI, компании, специализирующейся на оценке больших языковых моделей (LLM), вызвало обеспокоенность по поводу нарушения авторских прав и использования данных, защищенных авторским правом, при обучении моделей ИИ. В исследовании, опубликованном в среду, были протестированы четыре модели искусственного интеллекта: GPT-4 от OpenAI, Claude 2 от Anthropic, Llama 2 от Meta и Mixtral от Mistral AI. Удивлен, что они пропустили Близнецов.

Патронус ИИ использовал свои недавно обнаруженные «CopyrightCatcher», чтобы проанализировать ответы моделей на подсказки, связанные с популярными книгами, защищенными авторским правом. Задача была простой: подсказки предлагали моделям либо завершить отрывок из книги, либо предоставить первый отрывок конкретной книги.

Все четыре модели ИИ в той или иной степени создавали контент, содержащий материалы, защищенные авторским правом.

GPT-4 от OpenAI выдал наибольшее количество подсказок (44%) с текстом, защищенным авторским правом.
Claude 2 от Anthropic был самым осторожным: контент, защищенный авторским правом, создавался только в 16% запросов на завершение. Он также отказался отвечать на все запросы первого прохода, сославшись на отсутствие доступа к материалам, защищенным авторским правом. (Клод 3 недавно вышел., и Anhtropic уверен, что это лучше, чем у других LLM)
Llama 2 от Meta создавала контент, защищенный авторским правом, в 10% запросов.
Mixtral от Mistral продемонстрировал более высокую склонность к завершению первых отрывков (38%), чем более крупные фрагменты текста (6%).

Выводы Patronus AI призывают к активным шагам по решению проблем авторского права и продвижению ответственных и этических практик для процветания инноваций. Было бы лучше добавить к тесту и Gemini.

Девеш Бери

Технический журналист

Это то, что меня мотивирует: создавать информативный и полезный контент, заниматься своей страстью к автоспорту и музыке, участвовать в экспедициях, вести здоровый образ жизни и проводить время с моим очаровательным котом Тако.