Microsoft Azure AI представляє «Prompt Shields» для боротьби з маніпуляціями LLM

Значок часу читання 2 хв. читати

Піктограма календаря Опубліковано Березня 28, 2024

опубліковано на Березня 28, 2024

Читачі допомагають підтримувати MSpoweruser. Ми можемо отримати комісію, якщо ви купуєте через наші посилання.

Microsoft сьогодні оголошений значне підвищення безпеки для платформ Azure OpenAI Service і Azure AI Content Safety. Нова функція під назвою «Prompt Shields» пропонує надійний захист від дедалі складніших атак, націлених на великі мовні моделі (LLM).

Prompt Shields захищає від:

Прямі атаки: Також відомі як атаки джейлбрейка, ці спроби явно вказують LLM ігнорувати протоколи безпеки або виконувати зловмисні дії.
Непрямі атаки: Ці атаки непомітно вбудовують шкідливі інструкції в начебто звичайний текст, щоб обманом спонукати LLM до небажаної поведінки.

Prompt Shields інтегровано з фільтрами вмісту Azure OpenAI Service і доступно в Azure AI Content Safety. Завдяки вдосконаленим алгоритмам машинного навчання та обробці природної мови Prompt Shields може ідентифікувати та нейтралізувати потенційні загрози в підказках користувачів і сторонніх даних.

Прожектор: нова техніка захисту

Корпорація Майкрософт також представила «Spotlighting», спеціалізований оперативний інженерний підхід, призначений для запобігання непрямим атакам. Методи висвітлення, такі як розмежування та позначення даних, допомагають LLM чітко розрізняти законні інструкції та потенційно шкідливі вбудовані команди.

доступність

Prompt Shields наразі доступний для загальнодоступної попередньої версії в рамках безпеки вмісту AI Azure і буде доступний у службі Azure OpenAI 1 квітня. Найближчим часом планується інтеграція в Azure AI Studio.

Прадіп Вісвав

Експерт з програмного забезпечення та послуг

Прадіп є випускником інформатики та інженерії. Він також був студентським партнером Microsoft. Зараз працює у провідній IT-компанії.