Nghiên cứu cho thấy ChatGPT có nhiều dữ liệu được sao chép nhất so với các LLM hàng đầu khác

Biểu tượng thời gian đọc 2 phút đọc

Biểu tượng lịch Được đăng trên 6 Tháng ba, 2024

Được xuất bản trên 6 Tháng ba, 2024

Bạn đọc giúp đỡ ủng hộ MSpoweruser. Chúng tôi có thể nhận được hoa hồng nếu bạn mua thông qua các liên kết của chúng tôi.

Ghi chú chính

Các mô hình AI như GPT-4 và Claude 2 được phát hiện có khả năng tạo văn bản chứa tài liệu có bản quyền.
GPT-4 của OpenAI là ít thận trọng nhất, có khả năng vi phạm bản quyền trong 44% lời nhắc được thử nghiệm.

Một nghiên cứu mới của Patronus AI, một công ty chuyên đánh giá các mô hình ngôn ngữ lớn (LLM), đã làm dấy lên mối lo ngại về việc vi phạm bản quyền và việc sử dụng dữ liệu có bản quyền trong việc đào tạo các mô hình AI. Nghiên cứu được công bố hôm thứ Tư đã thử nghiệm bốn mô hình AI: GPT-4 của OpenAI, Claude 2 của Anthropic, Llama 2 của Meta và Mixtral của Mistral AI. Ngạc nhiên vì họ đã bỏ lỡ Song Tử

Patronus AI đã sử dụng “CopyrightCatcher” để phân tích phản hồi của người mẫu đối với các lời nhắc liên quan đến sách có bản quyền phổ biến. Thử thách rất đơn giản: các gợi ý thách thức người mẫu hoàn thành một đoạn văn trong sách hoặc cung cấp đoạn văn đầu tiên của một cuốn sách cụ thể.

Tất cả bốn mô hình AI đều tạo ra nội dung có tài liệu có bản quyền ở một mức độ nào đó.

GPT-4 của OpenAI tạo ra số lượng lời nhắc cao nhất (44%) với văn bản có bản quyền.
Claude 2 của Anthropic là người thận trọng nhất, tạo ra nội dung có bản quyền chỉ trong 16% số lần nhắc hoàn thành. Nó cũng từ chối trả lời tất cả các lời nhắc ở đoạn đầu tiên, với lý do thiếu quyền truy cập vào các tài liệu có bản quyền. (Claude 3 vừa được phát hành, và Anhtropic tự tin là nó tốt hơn các LLM khác)
Llama 2 của Meta tạo ra nội dung có bản quyền trong 10% lời nhắc.
Mistral's Mixtral cho thấy xu hướng hoàn thành đoạn văn đầu tiên cao hơn (38%) so với các đoạn văn bản lớn hơn (6%).

Những phát hiện của Patronus AI kêu gọi các bước chủ động để giải quyết các mối lo ngại về bản quyền và thúc đẩy các hoạt động có trách nhiệm và đạo đức để sự đổi mới phát triển mạnh mẽ. Sẽ tốt hơn nếu thêm cả Song Tử vào cuộc thử nghiệm.

Devesh Beri

Nhà báo công nghệ

Đây là những điều thúc đẩy tôi - tạo ra nội dung giàu thông tin và hữu ích, theo đuổi niềm đam mê đua xe thể thao và âm nhạc, tham gia các cuộc thám hiểm, duy trì lối sống lành mạnh và dành thời gian với chú mèo Taco đáng yêu của tôi.