Microsoft Azure AI tiết lộ 'Prompt Shields' để chống thao túng LLM

Biểu tượng thời gian đọc 2 phút đọc


Bạn đọc giúp đỡ ủng hộ MSpoweruser. Chúng tôi có thể nhận được hoa hồng nếu bạn mua thông qua các liên kết của chúng tôi. Biểu tượng chú giải công cụ

Đọc trang tiết lộ của chúng tôi để tìm hiểu cách bạn có thể giúp MSPoweruser duy trì nhóm biên tập Tìm hiểu thêm

Lá chắn nhắc nhở AI của Microsoft Azure

Microsoft hiện nay công bố một cải tiến bảo mật lớn cho Dịch vụ Azure OpenAI và nền tảng An toàn nội dung Azure AI. Được mệnh danh là “Tấm chắn nhắc nhở”, tính năng mới cung cấp khả năng phòng thủ mạnh mẽ trước các cuộc tấn công ngày càng tinh vi nhắm vào các mô hình ngôn ngữ lớn (LLM).

Khiên nhắc nhở bảo vệ chống lại:

  • Tấn công trực tiếp: Còn được gọi là các cuộc tấn công bẻ khóa, những nỗ lực này hướng dẫn rõ ràng LLM bỏ qua các giao thức an toàn hoặc thực hiện các hành động độc hại.
  • Tấn công gián tiếp: Các cuộc tấn công này nhúng các hướng dẫn có hại một cách tinh vi vào trong văn bản có vẻ bình thường, nhằm mục đích đánh lừa LLM thực hiện hành vi không mong muốn.

Khiên nhắc nhở được tích hợp với các bộ lọc nội dung Dịch vụ Azure OpenAI và có sẵn trong An toàn nội dung Azure AI. Nhờ các thuật toán học máy tiên tiến và xử lý ngôn ngữ tự nhiên, khiên nhắc nhở có thể xác định và vô hiệu hóa các mối đe dọa tiềm ẩn trong lời nhắc của người dùng và dữ liệu của bên thứ ba.

Làm nổi bật: Một kỹ thuật phòng thủ mới lạ

Microsoft cũng giới thiệu “Spotlighting”, một phương pháp tiếp cận kỹ thuật nhanh chóng chuyên biệt được thiết kế để ngăn chặn các cuộc tấn công gián tiếp. Các kỹ thuật làm nổi bật, chẳng hạn như phân cách và đánh dấu dữ liệu, giúp LLM phân biệt rõ ràng giữa các hướng dẫn hợp pháp và các lệnh nhúng có khả năng gây hại.

Sự có sẵn

Nhắc Shields hiện đang ở dạng bản xem trước công khai như một phần của An toàn nội dung Azure AI và sẽ có sẵn trong Dịch vụ Azure OpenAI vào ngày 1 tháng XNUMX. Việc tích hợp vào Azure AI Studio được lên kế hoạch trong tương lai gần.